"革新粒子加速器故障检测:机器学习在EuXFEL中的应用"

A Two-Stage Machine Learning-Aided Approach for Quench Identification at the European XFEL

摘要

本文介绍了一种应用于欧洲X射线自由电子激光(EuXFEL)中 quench 识别的机器学习辅助故障检测和隔离方法。EuXFEL 使用800个超导射频腔来加速电子束至高达17.5 GeV的能量。各种故障事件可能干扰加速器的正常运行,包括可能导致腔体超导性丧失并中断其操作的 quench 事件。本文提出的解决方案采用两阶段方法分析反映腔体动态的信号:(I)故障检测阶段使用分析冗余处理数据并生成残差,通过广义似然比评估残差以检测故障行为;(II)故障隔离阶段通过 k-medoids 算法区分 quench 和其他故障。最后,通过与当前部署的 quench 检测系统比较,展示了新方法的改进性能。

原理

本文提出的两阶段机器学习辅助方法的核心在于结合物理模型和数据驱动技术来提高故障检测和隔离的准确性。第一阶段,利用非线性奇偶空间方法生成残差,并通过广义似然比(GLR)进行评估,以自动检测故障。第二阶段,使用 k-medoids 聚类算法,结合欧几里得(EUC)和动态时间规整(DTW)两种相似性度量,从统计结果中学习 quench 模型,进一步区分 quench 和其他类型的故障。这种方法的优势在于其适用于在线处理设置,并且在解释性方面对低级射频(LLRF)专家非常重要。

流程

  1. 故障检测阶段:首先,利用超导腔的物理模型生成残差,通过非线性奇偶空间方法处理。然后,使用广义似然比(GLR)评估这些残差,以检测故障行为。
  2. 故障隔离阶段:在检测到故障后,使用 k-medoids 聚类算法,结合 EUC 和 DTW 两种相似性度量,对 quench 和其他故障进行区分。具体来说,通过计算新故障信号与 quench 聚类模型之间的距离,利用阈值和决策边界来判断是否为 quench。
  3. 评估与比较:通过实验评估新方法的性能,并与当前部署的 quench 检测系统进行比较,使用接收操作特征(ROC)曲线下面积(AUC)来量化性能。

应用

本文提出的方法不仅适用于 EuXFEL,还可推广到其他粒子加速器和复杂系统的故障检测与隔离。随着技术的进一步发展和优化,预计将在提高加速器的可用性、安全性和可靠性方面发挥重要作用,减少潜在的能源和财务损失,并避免设施的退化。