发现半平稳时间序列中的因果关系:PCMCIΩ 算法的创新与应用
摘要
本文提出了一种非参数、基于约束的因果发现算法 PCMCIΩ,用于半平稳时间序列数据。该算法可以发现时间序列数据中因果结构的周期性变化,并且可以在不假设平稳性的情况下发现因果关系。实验结果表明,该算法在连续值和离散值时间序列数据上均具有有效性和正确性。
原理
PCMCIΩ 算法基于 PCMCI 算法,通过构建时间分区子集和估计父集,利用条件独立性测试来发现因果关系。具体来说,该算法首先使用 PCMCI 算法获得父集的超集,然后通过猜测周期性来构建时间分区子集,并在每个子集中维护一个父集。接着,使用条件独立性测试来检验 Xi t−τ 和 Xj t 之间的因果关系,并根据测试结果更新父集。最后,通过选择最小化最大父集大小的周期性来估计真实的周期性。
流程
- 输入:一个 n 维时间序列 V = (X1, X2, X3, …, Xn),周期性上限 ωub,时间滞后上限 τub。
 - 使用 PCMCI 算法获得父集的超集,并将其表示为 SPa(Xj t )。
 - 对于每个变量 Xj,猜测其周期性 ω,并构建时间分区子集 Πj k。
 - 在每个时间分区子集中,初始化父集为 SPa(Xj t ),并使用条件独立性测试来检验 Xi t−τ 和 Xj t 之间的因果关系。
 - 根据测试结果更新父集,并存储每个时间分区子集中的父集。
 - 重复步骤 3-5,直到猜测的周期性达到上限。
 - 选择最小化最大父集大小的周期性作为估计的周期性,并将相应的父集设置为最终的父集。
 - 返回估计的周期性和父集。
 
应用
该算法可以应用于许多领域,如气候科学、金融市场分析、医疗保健等。它可以帮助研究人员发现时间序列数据中隐藏的因果关系,从而更好地理解和预测系统的行为。
