提升分布外检测:结合现有后验方法的新策略
摘要
本文探讨了如何通过结合现有的后验方法来改进深度学习模型中的分布外(Out-of-Distribution, OOD)检测。OOD检测是确保机器学习模型在安全关键应用中可靠性的关键步骤。尽管已有多种OOD检测方法,但每种方法在不同数据集上的表现不一,因此本文提出了一种新的策略,通过集成多种检测分数来构建一个统一的OOD检测器。本文提出了四种组合策略,包括多数投票、基于经验累积分布函数(CDF)和基于最优传输的多变量分位数等方法,并扩展了常用的OOD评估指标以适应多维OOD检测器。实验结果表明,这些组合策略在多个基准测试中显著提高了OOD检测的性能。此外,本文还提出了一系列指导原则,用于在没有已知OOD数据的情况下选择最佳的OOD检测器组合。
原理
本文的核心在于通过组合现有的OOD检测分数来提高检测性能。具体来说,作者提出了四种组合方法:
- 多数投票:通过多数投票机制集成多个OOD检测器的二元决策。
 - 经验累积分布函数(CDF):使用非参数方法估计多维CDF,并基于此构建OOD检测器。
 - 基于Copulas的参数CDF:使用参数估计方法和Copulas函数来建模多维CDF,从而构建OOD检测器。
 - 基于中心向外分位数:利用最优传输理论中的中心向外分位数方法来估计多维OOD分数的分位数,并构建OOD检测器。
 
这些方法的关键在于如何有效地集成多个OOD分数,以捕捉不同分数之间的互补信息,从而提高整体的OOD检测能力。
流程
- 数据准备:使用公开的预训练神经网络和数据集进行实验。
 - 分数计算:计算多个OOD检测方法的分数。
 - 分数组合:应用提出的四种组合方法之一来集成这些分数。
 - 评估:使用扩展的OOD评估指标(如AUROC和FPR在固定TPR率下)来评估组合后的OOD检测器。
 - 选择最佳组合:根据评估结果选择最佳的OOD检测器组合。
 
例如,对于多数投票方法,工作流程如下:
- 计算每个OOD检测器的二元决策(ID或OOD)。
 - 对所有检测器的决策进行多数投票,确定最终的分类结果。
 - 使用AUROC等指标评估多数投票结果的性能。
 
应用
本文提出的OOD检测器组合方法可以广泛应用于需要高可靠性机器学习模型的领域,如自动驾驶、医疗诊断和金融风险评估等。通过提高OOD检测的准确性,这些方法有助于增强模型的鲁棒性和安全性,从而推动机器学习在安全关键应用中的广泛采用。
