BackMix:革新心电图视图分类的背景增强技术
摘要
本文由Kit M. Bransby等人撰写,针对心电图(echocardiography)视图分类中神经网络学习到的不良快捷方式(shortcut learning)问题,提出了一种名为BackMix的简单而有效的随机背景增强方法。该方法通过在训练集中随机交换背景,强制模型关注超声扇区(ultrasound sector)内的数据,从而提高分类准确性和泛化能力。此外,论文还提出了wBackMix方法,通过重新加权分类损失,增强增强样本的贡献。实验结果表明,即使在仅有5%的分割标签的半监督设置下,BackMix也能显著提升分类性能和关注度指标。
原理
BackMix方法的核心在于通过随机交换训练图像的背景,使得背景与分类结果无关,从而迫使模型学习关注超声扇区内的图像内容。具体来说,BackMix在训练过程中将图像分割为扇区和背景两部分,然后随机选择另一图像的背景替换当前图像的背景,生成新的训练样本。这种方法不仅简便,而且不增加任何额外的参数或架构变化,也不增加训练或推理时间。通过这种方式,模型学会了忽略背景中的伪相关特征,专注于超声图像的实质内容,从而提高了模型的泛化能力和分类准确性。
流程
BackMix的工作流程包括以下几个步骤:
- 图像分割:使用分割掩码将训练图像分割为超声扇区和背景。
 - 背景替换:随机选择另一个训练图像的背景,替换当前图像的背景。
 - 合成新样本:将原始图像的超声扇区与新选择的背景合成新的训练样本。
 - 损失加权:通过wBackMix方法,对使用BackMix增强的样本进行损失加权,增加其对训练的贡献。
 
例如,在训练ResNet18网络时,首先对图像进行标准的数据增强(如旋转、亮度调整等),然后应用BackMix方法生成新的训练样本。在推理阶段,无需使用分割掩码,模型可以直接对图像进行分类。
应用
BackMix方法在心电图视图分类中显示出显著的性能提升,特别是在处理分布外(out-of-distribution)数据时。这种方法不仅适用于心电图,还可以扩展到其他医学图像分析领域,如放射学、病理学等,其中背景信息可能误导模型。此外,BackMix的半监督学习特性使其在数据标注有限的情况下尤为有用,有助于降低数据准备的成本和时间。随着进一步的研究和优化,BackMix有望成为医学图像分析中的一个重要工具。
