FANFOLD:开创性的图归一化流驱动的非对称网络,引领无监督图级异常检测新纪元

FANFOLD: Graph Normalizing Flows-driven Asymmetric Network for Unsupervised Graph-Level Anomaly Detection

摘要

本文介绍了一种名为FANFOLD的新型图归一化流驱动的非对称网络,用于无监督图级异常检测。该研究针对现有基于知识蒸馏的方法在图级异常检测中存在的对称性问题,提出了一种非对称网络结构,通过引入归一化流来学习样本的潜在分布,从而有效区分正常图和异常图。FANFOLD在训练阶段将正常图的原始分布转换为标准正态分布,在推理阶段利用源-目标损失计算异常分数,以区分正常和异常图。实验结果表明,FANFOLD在15个不同领域的数据集上优于9种基线方法,显示出其在无监督图级异常检测任务中的优越性。

原理

FANFOLD的核心在于利用归一化流技术来处理源网络中的图数据,通过非对称网络结构来增强异常检测的性能。归一化流是一种生成模型,能够将复杂的数据分布映射到简单的概率分布(如标准正态分布),通过一系列可逆且可微分的映射实现。在FANFOLD中,归一化流被应用于源网络,将图数据的分布转换为标准正态分布,从而在源网络和目标网络之间建立非对称性。这种非对称性使得两个网络在处理正常图和异常图时产生不同的输出,进而通过计算源-目标损失来识别异常图。

流程

FANFOLD的工作流程包括四个关键阶段:数据预处理、源网络编码器预训练、归一化流处理和目标网络训练。首先,对图数据进行预处理,提取节点属性和图拓扑信息。然后,使用图神经网络(GNN)对源网络进行预训练,以学习图数据的复杂结构特征。接着,应用归一化流将源网络中的图数据分布转换为标准正态分布。最后,目标网络通过最小化与源网络输出的距离来学习正常图的模式和特征分布。在推理阶段,通过计算每个图的异常分数来识别异常图。

应用

FANFOLD在多个领域如社交网络、生物系统和交通网络中的图级异常检测具有广泛的应用前景。由于其能够有效区分正常图和异常图,FANFOLD可用于自动识别潜在威胁,提供一种可扩展和适应性强的解决方案。此外,FANFOLD的非对称网络结构和归一化流技术为无监督图级异常检测提供了新的研究方向,有望推动该领域的发展。