高效无环因果图采样:一种可扩展的贝叶斯因果发现方法
摘要
本文介绍了一种可扩展的贝叶斯因果发现方法,该方法能够在不显式强制无环性的情况下,有效地从观测数据中学习因果图的后验分布。传统的因果发现方法在处理大规模问题时面临计算上的挑战,尤其是在确保无环性约束方面。本文提出的方法通过引入一种新颖的可微分DAG采样技术,能够高效地生成无环因果图,并通过变分推断框架学习因果图的后验分布。实验结果表明,该方法在合成数据集和真实数据集上都表现出色,优于现有的几种先进方法。
原理
本文提出的方法核心在于一种新颖的可微分DAG采样技术,该技术通过将无约束的隐式拓扑顺序分布映射到DAG分布,从而无需显式地强制无环性。具体来说,该方法通过生成一个表示任意有向图的二进制邻接矩阵和一个节点优先级得分向量来采样DAG。这些得分在排序时隐式定义了一个拓扑顺序,从而诱导出一个拓扑矩阵,轻松确保无环性。最终,通过将生成的二进制邻接矩阵与拓扑矩阵进行元素级乘法,得到DAG,从而将DAG采样的时间复杂度降低到节点数量的二次方,实现了在毫秒级内生成包含数千个节点的DAG。
流程
该方法的工作流程包括以下几个步骤:
- 从两个任意概率模型中采样一个优先级得分向量p和一个二进制矩阵W。
 - 使用梯度算子后跟一个温度调节的sigmoid函数,构建一个表示完整拓扑图的二进制邻接矩阵,称为拓扑矩阵。
 - 最终的DAG邻接矩阵A是W和从p导出的拓扑矩阵的元素级乘积。 具体示例见图1,展示了如何通过上述步骤生成有效的无环因果结构。
 
应用
该方法的应用前景广泛,特别是在需要从大规模观测数据中推断因果关系的领域,如政策决策制定、实验设计、增强AI的可信度等。由于其高效性和可扩展性,该方法能够处理高维数据,为因果发现提供了一种强大的工具。
