FedMLP:解决医疗图像多标签分类任务异质性的创新联邦学习方法

FedMLP: Federated Multi-Label Medical Image Classification under Task Heterogeneity

摘要

本文介绍了一种名为FedMLP的新型联邦学习方法,旨在解决医疗图像分类中的多标签任务异质性问题。在临床实践中,由于医疗知识和疾病流行程度的不同,每个机构可能只诊断部分类别,导致任务异质性。FedMLP通过伪标签标记和全局知识学习两个阶段,有效地补充了缺失的标签,并利用全局模型作为教师进行一致性正则化,防止遗忘缺失类别的知识。实验结果表明,FedMLP在两个公开的医疗数据集上优于现有的联邦半监督和噪声标签学习方法。

原理

FedMLP的工作原理分为两个阶段:伪标签标记和全局知识学习。在第一阶段,利用预热模型生成类别原型,并选择高置信度的样本来补充缺失的标签。第二阶段,使用全局模型作为教师,通过一致性正则化来防止遗忘缺失类别的知识。这种方法通过全局模型和局部模型的交互,有效地整合了来自不同任务的知识,提高了模型在多标签分类任务中的性能。

流程

FedMLP的工作流程如下:

  1. 预热阶段:每个客户端使用多标签加权部分类别(WPC)损失和逻辑调整(LA)进行训练,生成高质量的类别原型。
  2. 缺失标签检测阶段:利用全局活动类别原型,选择高置信度的样本来进行伪标签标记,并通过自适应阈值机制调整样本选择比例。
  3. 一致性正则化:使用全局模型作为教师,对局部模型进行一致性正则化,确保模型不会遗忘缺失类别的知识。
  4. 模型聚合:在每个通信轮次结束时,服务器聚合所有客户端的模型和原型,更新全局模型和原型。

应用

FedMLP在医疗图像分类领域具有广泛的应用前景,特别是在多标签分类任务中,能够有效处理由于任务异质性导致的标签缺失问题。此外,该方法还可以扩展到其他需要多标签分类的领域,如生物信息学、自然语言处理等,具有很高的实用价值和研究潜力。