探索时间序列中的因果机制变化:Causal-RuLSIF算法的前沿应用

Causal Discovery-Driven Change Point Detection in Time Series

摘要

本文介绍了一种名为Causal-RuLSIF的新型非参数算法,旨在检测离散值时间序列数据中的因果机制变化点。该算法通过结合约束基础的因果结构发现方法和条件相对皮尔逊散度估计,能够在不假设因果机制或数据分布形式的情况下,准确识别时间序列中的变化点。实验结果表明,该方法在合成和真实世界数据集上都具有良好的正确性和实用性。

原理

Causal-RuLSIF算法的核心在于其两阶段过程:首先,通过基于约束的发现方法学习因果结构的一部分;然后,使用条件相对皮尔逊散度估计来识别变化点。条件相对皮尔逊散度用于量化时间序列中连续段之间的分布差异,而因果发现方法则有助于聚焦于因果机制,从而获得独立同分布(IID)样本。该算法利用了因果马尔可夫条件的理论基础,放松了传统变化点检测方法中样本必须IID的假设。

流程

算法的工作流程包括以下步骤:

  1. 使用PCMCI算法获取每个变量的父集超集。
  2. 根据父集配置构建时间序列段。
  3. 在滑动窗口上应用RuLSIF算法,获取散度系列。
  4. 选择具有最大散度值的时间序列段和窗口索引,作为变化点估计。
  5. 将估计的变化点投影回原始时间序列。
  6. 可选地,在变化点前后样本上运行PCMCI,以完全学习潜在的因果图。

应用

Causal-RuLSIF算法在多个领域具有广泛的应用前景,特别是在需要检测时间序列中因果机制变化的场景,如人活动感应、医疗科学和金融市场的变化点分析。该算法的非参数性质和理论保证使其在安全关键应用中具有高度的可信度。