"FADeR:解决无监督异常检测中的不完整掩蔽问题"

Feature Attenuation of Defective Representation Can Resolve Incomplete Masking on Anomaly Detection

摘要

本文由YeongHyeon Park等人提出,针对无监督异常检测(UAD)中的不完整掩蔽问题,提出了一种名为“缺陷表示的特征衰减”(FADeR)的方法。在UAD研究中,尽管最先进的模型在公共基准数据集上已经达到了饱和点,但它们通常采用大规模定制神经网络(NN)以提高检测性能或追求多任务统一模型。为了适应边缘计算环境,需要开发计算效率高且可扩展的解决方案,避免使用大规模复杂NN。FADeR通过仅使用两层多层感知器(MLP)在解码过程中衰减异常重建的特征信息,将未见过的异常模式重建为已见过的正常模式,从而减少误报。实验结果表明,FADeR在性能上优于类似规模的NN,并且在与其它单一确定性掩蔽方法集成时,表现出性能增强的可扩展性。

原理

FADeR的核心原理是通过两层MLP结构,在解码过程中对异常特征进行衰减。具体来说,FADeR将视觉缺陷混淆图像分割成补丁,并预测每个补丁的重建错误。高重建错误值意味着该补丁很可能是缺陷区域。FADeR在将这些补丁传递给解码器之前,衰减编码的特征表示。解码器接收到的特征图具有衰减的缺陷表示,这有助于将缺陷重建为已知的正常模式。此外,FADeR利用主动学习策略进行训练,因为缺陷特征衰减没有标签。这种策略允许NN在几乎没有标签数据的情况下进行训练。

流程

FADeR的工作流程包括以下步骤:

  1. 图像分割:将视觉缺陷混淆图像分割成补丁。
  2. 错误预测:使用两层MLP预测每个补丁的重建错误。
  3. 特征衰减:根据预测的错误值,衰减缺陷补丁的编码特征表示。
  4. 解码重建:将衰减后的特征图传递给解码器,进行正常模式的重建。
  5. 训练:利用主动学习策略,通过重建错误来构造训练的地面真实(GT)损失,迭代训练FADeR以预测GT损失。

应用

FADeR的应用前景广泛,特别是在工业视觉检查中,如MVTec AD和VisA数据集所示。它能够有效解决单一确定性掩蔽方法中的不完整掩蔽问题,提高异常检测的准确性和效率。此外,FADeR的可扩展性和与其它UAD模型的兼容性使其成为工业环境中边缘计算的理想选择。