探索卫星遥测数据中的异常:OPS-SAT基准数据集的先进性与应用前景
摘要
本文介绍了一种用于检测卫星遥测数据异常的OPS-SAT基准数据集(OPSSAT-AD)。该数据集由欧洲航天局(ESA)操作的OPS-SAT CubeSat任务收集,包含真实的卫星遥测数据和地面真实注释,用于训练和验证监督模型。论文提出了一种公平、可重复和客观的验证程序,以无偏见和完全透明的方式量化新兴异常检测技术的性能。此外,论文还提供了30种监督和非监督的经典和深度机器学习算法的基准结果,以及建议的质量指标,以帮助社区在实际卫星遥测中公平和无偏见地创建和比较异常检测方法。
原理
OPS-SAT基准数据集的工作原理基于以下几个关键步骤:首先,从ESA OPS-SAT卫星收集原始遥测数据,并通过在线可视化和注释工具OXI进行人工注释。然后,设计了18种手工特征,用于描述每个遥测片段的统计特性,如信号值的算术平均、标准差、峰度等。这些特征被用于训练和测试30种不同的异常检测算法,包括监督和非监督方法。通过使用建议的质量指标(如准确性、精确度、召回率、F1分数等)来评估这些算法在测试集上的性能,确保了评估的客观性和可重复性。
流程
论文提供了一个详细的工作流程,包括数据加载、数据集分割、可选的预处理步骤、模型训练和性能量化。具体步骤如下:
- 从dataset.csv文件加载数据集。
 - 根据文件中的⟨train⟩属性将数据集分割为训练集(TTT)和测试集(Ψ)。
 - 可选地进行数据标准化、特征提取和特征选择等预处理步骤。
 - 在TTT上训练机器学习模型。
 - 使用建议的质量指标在Ψ上量化算法的性能。
 
应用
OPS-SAT基准数据集的应用前景广泛,特别是在卫星操作和维护领域。通过提供一个包含真实遥测数据和注释的公开数据集,该基准有助于推动异常检测技术的发展,特别是在资源受限的环境中,如CubeSat任务。此外,随着OPS-SAT VOLT的即将发射,该基准还将为在实际操作环境中验证和部署这些算法提供机会。
