TeVAE:一种用于多变量时间序列在线异常检测的变分自编码器方法
摘要
本文介绍了一种名为TeVAE的变分自编码器方法,用于汽车测试领域中的在线异常检测。随着记录数据的增加,手动评估的局限性日益明显,因此需要自动化的在线异常检测系统。TeVAE能够处理复杂的多变量时间序列数据,并在训练未标记数据时最小化误报。该方法避免了“绕过现象”,并引入了一种新的方法将单个窗口重新映射到连续时间序列。此外,本文还提出了一系列评估检测延迟和根本原因能力的指标,并在实际工业数据集上进行了实验。TeVAE在正确配置下,仅在6%的时间内错误地标记异常,并能检测到65%的实际异常。
原理
TeVAE的核心是一个基于双向长短期记忆网络(BiLSTM)的变分自编码器架构,该架构将时间序列窗口映射到时间潜在分布。此外,还引入了一个多头注意力(MA)机制,以进一步增强采样的潜在矩阵,然后将其传递给解码器。这种架构避免了所谓的“绕过现象”,即信息流主要或仅通过注意力机制,避免了通过DKL项的正则化。TeVAE还提出了一种独特的方法,用于将模型训练的固定长度窗口重新映射到连续的可变长度序列,即时间序列。此外,本文还提出了一套适用于在线时间序列异常检测的指标,这些指标不仅可解释且简单,还与离散时间序列异常检测兼容。
流程
TeVAE的工作流程包括以下步骤:首先,编码器将输入窗口映射到时间潜在分布的参数。然后,从该分布中采样潜在矩阵,并通过多头注意力机制增强。最后,解码器将增强后的潜在矩阵映射回原始数据空间,生成重构的时间序列。在推理模式下,采样过程被禁用,仅使用潜在矩阵的均值作为输入。此外,TeVAE还引入了一种逆窗口处理方法,用于将固定长度的窗口重新映射到连续的时间序列,以便进行异常检测。
应用
TeVAE在汽车动力总成测试等复杂多变量时间序列数据的在线异常检测中具有广泛的应用前景。由于其能够处理高度动态和可变状态的数据,TeVAE可以显著提高测试效率,减少维护和停机时间,并防止对测试对象的损害。此外,TeVAE的自动异常检测能力可以无缝集成到现有的测试系统中,提供及时的异常洞察,从而节省时间和成本。
