探索青光眼诊断新前沿:Graph-Guided Test-Time Adaptation框架的突破与应用
摘要
本文介绍了一种名为Graph-Guided Test-Time Adaptation (GTTA)的创新框架,用于通过眼底摄影图像进行青光眼的自动诊断。青光眼是全球导致不可逆失明的主要原因之一,而深度学习技术在眼底图像上的应用已显著提高了早期诊断的准确性。然而,不同设备和地点获取的图像(即域偏移)对预训练模型在实际应用中的泛化能力提出了挑战。GTTA框架通过整合眼底图像的拓扑信息到模型训练中,增强了模型的可迁移性,并减少了学习虚假相关性的风险。在推理阶段,GTTA引入了一种新颖的测试时间训练目标,使源训练的分类器逐步适应目标模式,同时进行可靠的类条件估计和一致性正则化。实验结果表明,GTTA在跨域青光眼诊断基准测试中表现优异,显示出其先进性和潜在的临床应用价值。
原理
GTTA框架的核心在于利用图辅助的关系感知训练(GRT)模块和测试时间预测消歧(TPD)策略。在训练阶段,GRT模块通过学习基于骨干模型提取的隐藏特征的拓扑关系,来学习可泛化的深度表示。在推理阶段,TPD策略通过在线方式更新源模型的权重,使用未标记的目标数据,从而实现模型对新环境的适应。具体来说,TPD通过引入记忆库来动态存储目标数据特征和逻辑,利用类条件估计和邻近信息来更新模型参数,增强分类器的鲁棒性。
流程
GTTA的工作流程分为两个主要阶段:训练阶段和推理阶段。在训练阶段,GRT模块接收骨干特征提取器提取的隐藏特征,并将其分割成一组向量,每个向量对应输入图像的某个区域。这些向量通过线性投影进入一个嵌入空间,并添加可学习的1D位置嵌入。通过图自注意力机制更新节点特征,并使用top-k池化进行节点下采样,最终通过线性分类器获得预测值。在推理阶段,TPD策略通过记忆库存储目标数据特征,利用邻近信息和类条件估计来更新模型参数,实现模型对新数据的适应。
应用
GTTA框架不仅适用于青光眼的自动诊断,还可以扩展到其他存在分布偏移的医学图像分析场景中,如癌症检测、心脏病诊断等。其强大的域适应能力和鲁棒性使其在临床实践中具有广泛的应用前景,能够提高诊断的准确性和效率,降低医疗成本,减轻医疗系统的负担。
