"REGAD:利用强化学习在噪声标签环境下提升图异常检测性能"

Graph Anomaly Detection with Noisy Labels by Reinforcement Learning

摘要

本文介绍了一种名为REGAD(REinforced Graph Anomaly Detector)的新型框架,用于在图异常检测(GAD)任务中处理带有噪声标签的问题。GAD在金融欺诈检测和社交网络机器人账户识别等领域有广泛应用。传统的GAD方法依赖高质量的标签数据,但在现实场景中,这些标签往往难以获取且可能包含噪声,导致性能严重下降。REGAD通过逐步剪除可疑节点的边来减轻噪声的影响,并设计了一个定制的动作和搜索空间来训练策略网络,以迭代优化策略。实验结果表明,REGAD在不同异常比例的三个数据集上均表现出优越的性能。

原理

REGAD框架的核心在于利用强化学习方法来优化图异常检测模型。具体来说,REGAD通过一个基础检测器(base detector)来评估每个节点的异常分数,并生成高置信度的标签集。然后,通过一个边缘剪枝器(edge pruner)来学习策略,逐步剪除与噪声标签相关的边。这个过程通过一个策略循环机制(policy-in-the-loop mechanism)来迭代优化,其中策略网络根据基础检测器的反馈进行更新。整个过程的目标是最大化基础检测器的性能改进(AUC),并通过累积奖励来评估整体性能。

流程

REGAD的工作流程包括以下几个关键步骤:

  1. 基础检测器评估每个节点的异常分数,并生成高置信度的异常集(AS)和正常集(NS)。
  2. 边缘剪枝器根据候选集(NC)中的节点,通过强化学习方法学习策略,逐步剪除可疑的边。
  3. 策略循环机制迭代优化策略网络,基础检测器根据剪枝后的图结构更新高置信度标签集。
  4. 通过累积奖励评估整体性能,奖励基于剪枝前后基础检测器的AUC性能差异。

应用

REGAD框架在处理带有噪声标签的图异常检测任务中展现出强大的潜力。其应用前景广泛,包括但不限于金融领域的欺诈检测、社交网络中的机器人账户识别、以及网络安全中的异常行为检测等。随着数据量的增加和数据质量的多样化,REGAD能够有效应对现实世界中标签噪声的问题,提高异常检测的准确性和鲁棒性。