"Curriculum by Masking (CBM): 一种创新的课程学习策略"
摘要
本文介绍了一种名为“Curriculum by Masking (CBM)”的创新课程学习策略,该策略通过图像块(token)的掩蔽来有效地创建从易到难的训练计划。CBM利用梯度幅度来优先掩蔽显著图像区域,通过一种新颖的掩蔽算法和掩蔽块,显著提高了传统训练制度和先前课程学习(CL)方法的准确性。CBM通过逐步引入更难的样本,控制样本难度通过掩蔽比例,为对象识别和检测提供了一种多功能的课程学习方法。实验在五个基准数据集上进行,比较了CBM与传统及课程学习训练制度,结果显示CBM策略相较于现有课程学习制度具有优越性,并在迁移学习环境中显示出显著的准确性提升。
原理
CBM的核心在于通过逐步增加图像块的掩蔽比例来创建一个从易到难的训练课程。该方法不依赖于预先对数据样本进行排序,而是通过控制掩蔽比例来完全控制数据样本的复杂性。CBM的关键创新之一是使用基于图像梯度幅度的概率分布来选择掩蔽的图像块,优先掩蔽包含显著特征的区域,从而增加图像中对象识别的难度。这种基于梯度的掩蔽策略确保了掩蔽过程能够有效地增加样本的难度,而不是简单地随机掩蔽。
流程
CBM的工作流程从完全可见的图像开始,随着训练的进行,逐步增加掩蔽比例以使样本变得更加困难。掩蔽主要集中在具有较高梯度幅度的更显著区域,以减少通过掩蔽背景信息产生简单图像的可能性。具体算法如算法1所示,首先计算需要掩蔽的图像块数量,然后根据概率分布选择并掩蔽这些块。整个过程重复进行,直到达到预设的最大掩蔽比例。
应用
CBM的应用前景广泛,特别适用于需要逐步增加训练难度的场景,如对象识别和对象检测。由于其不依赖于特定的网络架构,CBM可以广泛应用于各种神经网络模型,包括卷积网络和视觉变换器。此外,CBM在迁移学习环境中的表现也显示出其在不同领域和任务中的潜在价值。
