xSemAD:基于序列到序列模型的可解释语义异常检测技术
摘要
本文介绍了一种名为xSemAD的新型语义异常检测技术,该技术利用序列到序列(seq2seq)模型在事件日志中识别不期望的行为。传统的异常检测方法通常侧重于统计上的罕见行为,而忽略了罕见性与不期望性之间的细微差别。xSemAD通过从给定的过程模型库中学习约束,并检查这些约束在所考虑的事件日志中是否成立,从而提供扩展的解释。实验证明,xSemAD在语义异常检测方面优于现有的最先进方法。
原理
xSemAD的工作原理基于seq2seq模型的微调。首先,使用现有的过程模型库作为输入来微调seq2seq模型,使其学习活动之间的执行关系。然后,在异常检测阶段,使用微调后的模型(称为events2constraints模型)来确定所考虑事件日志中必须成立的约束。通过检查这些约束是否被事件日志中的实际执行关系所违反,来识别语义异常。这种基于约束的异常检测方法不仅有助于理解不期望行为的特定细节,还便于采取针对性的纠正措施。
流程
xSemAD的工作流程分为训练阶段和检测阶段。在训练阶段,使用过程模型库来微调seq2seq模型,以学习活动之间的执行约束。在检测阶段,使用微调后的模型生成约束,并检查这些约束是否被事件日志中的实际执行关系所违反。例如,考虑一个贷款申请过程的事件日志,xSemAD会生成如“贷款申请必须先于信用检查”等约束,并检查这些约束是否被违反。
应用
xSemAD的应用前景广泛,特别是在需要识别和解释复杂业务流程中不期望行为的领域。例如,在金融服务、医疗保健和供应链管理等行业,xSemAD可以帮助检测和预防违反业务规则的行为,从而提高流程的合规性和效率。此外,xSemAD的解释能力使其成为培训和教育领域的宝贵工具,帮助用户更好地理解和改进业务流程。
