LECODU:人机协作分类中的学习互补与延迟决策新方法
摘要
本文介绍了一种名为“Learning to Complement and to Defer to Multiple Users (LECODU)”的新型人工智能方法,旨在解决在分类任务中人机协作的复杂决策问题。LECODU结合了学习互补和学习延迟两种策略,不仅优化了分类准确性,还最小化了用户参与的协作成本。该方法通过在真实世界和合成数据集上的广泛评估,展示了其相对于现有最先进的人机协作分类方法的优越性能,尤其是在用户标注噪声较高的情况下。
原理
LECODU的核心在于其能够动态决定何时与专家协作(学习互补)、何时将决策延迟给专家(学习延迟),以及应该涉及多少专家。这种方法通过一个选择模块和一个协作模块实现,选择模块决定使用哪种协作策略,而协作模块则根据选择模块的输出进行最终的分类决策。LECODU利用包含多个噪声标签的训练集进行训练,通过最大化分类准确性和最小化协作成本来优化模型性能。
流程
LECODU的工作流程包括以下步骤:首先,预训练的AI模型对输入图像进行初步分类;然后,选择模块根据AI模型的预测和用户标注的噪声水平,决定是仅使用AI模型、与用户协作还是将决策延迟给用户;最后,协作模块根据选择模块的决策,结合AI预测和用户标注,生成最终的分类结果。整个过程通过Gumbel Softmax技巧实现梯度的连续计算,确保了训练过程的可微分性。
应用
LECODU方法在多个高风险领域的复杂问题中具有广泛的应用前景,如乳腺癌分类、风险评估和识别大型语言模型生成的错误信息。其能够在用户标注噪声较高的情况下仍保持高准确性,使得该方法在实际应用中具有很高的实用价值和推广潜力。
