"冷启动假新闻检测:结构对抗网络的新突破"

Transferring Structure Knowledge: A New Task to Fake news Detection Towards Cold-Start Propagation

摘要

本文探讨了一个新的任务:冷启动假新闻检测,旨在在没有传播数据的情况下检测仅包含内容的样本。传统的假新闻检测方法依赖于从内容和传播树中提取有效的语义和结构特征,但在实际应用中,特别是在缺乏传播数据的情况下,这些方法的性能会显著下降。为了解决这一问题,本文提出了一种简单而有效的结构对抗网络(SAN)框架,该框架能够从现有的传播中学习可转移的特征,以增强对仅包含内容的样本的检测能力。通过在三个数据集上进行定性和定量实验,结果显示了新任务的挑战性和SAN框架的有效性。

原理

SAN框架的核心在于引入一个结构判别器,该判别器用于估计学习到的特征在有和无传播情况下的差异,并进一步学习结构不变特征,以增强现有基于传播的方法对仅包含内容样本的泛化能力。具体来说,SAN框架通过一个结构判别器来预测目标新闻的高级表示是否包含结构属性。在训练阶段,原始特征提取器与假新闻检测器合作,同时特征提取器尝试欺骗结构判别器,以缩小有和无传播树的特征分布差距。通过这种方式,SAN框架能够有效地转移结构知识,从而提高对冷启动新闻的检测性能。

流程

SAN框架的工作流程如下:首先,输入样本包括源新闻内容和传播树,现有模型通过各种神经网络提取高级文本和结构特征。然后,SAN框架引入一个结构判别器,该判别器预测目标新闻的高级表示是否包含结构属性。在训练过程中,原始特征提取器与假新闻检测器合作,同时特征提取器尝试欺骗结构判别器,以缩小有和无传播树的特征分布差距。最终,通过优化模型参数,SAN框架能够有效地转移结构知识,从而提高对冷启动新闻的检测性能。

应用

SAN框架的应用前景广泛,特别是在社交媒体和新闻平台的假新闻检测中。由于社交媒体上的新闻往往缺乏完整的传播数据,SAN框架能够有效地提高这些平台对假新闻的检测能力。此外,SAN框架还可以应用于其他需要结构知识转移的领域,如推荐系统和社交网络分析等。