探索扩张ResNet模型在眼底疾病分类中的先进应用

Explainable AI: Comparative Analysis of Normal and Dilated ResNet Models for Fundus Disease Classification

摘要

本文介绍了一种使用扩张残差网络(Dilated ResNet)模型进行眼底疾病分类的方法。通过在ResNet模型的高层替换普通卷积滤波器为扩张卷积滤波器,该方法旨在提高模型对疾病的分类准确性并减少计算时间。研究使用了Ocular Disease Intelligent Recognition (ODIR)数据集,该数据集包含八种类型的常见眼底疾病。评估指标包括精确度、召回率、准确率和F1分数。研究对比了普通ResNet模型和扩张ResNet模型在五个不同深度的变体(ResNet-18, ResNet-34, ResNet-50, ResNet-101, ResNet-152)上的表现,结果显示扩张ResNet模型在多类疾病分类中表现更优。

原理

扩张卷积通过在卷积核元素之间引入间隙(由扩张因子决定)来扩展普通卷积的感受野。这种设计使得模型能够在不增加参数数量的情况下捕捉更广泛的上下文信息,同时减少内存和计算时间。扩张ResNet模型通过在网络的高层使用扩张卷积,有效地增加了感受野,从而能够更好地捕捉眼底图像中的细微疾病特征。此外,结合可解释AI技术(如LIME, RISE, Grad-CAM),该模型能够提供透明的决策过程,增强医疗专业人员对AI诊断决策的理解和信任。

流程

研究工作流程包括两个主要阶段:训练和测试。训练阶段包括预处理、扩张CNN和损失函数三个模块。预处理阶段将眼底图像调整为统一尺寸,并为每个图像分配一个八类向量。扩张CNN阶段使用五个不同深度的ResNet模型,通过在高层引入扩张卷积来改进模型的分类性能。损失函数采用稀疏分类交叉熵(SCCE),以提高多类别分类的效率。测试阶段则使用训练好的权重对疾病图像进行分类。通过对比不同模型的精确度、召回率和F1分数,研究显示扩张ResNet模型在多个疾病类别上的表现均优于普通ResNet模型。

应用

扩张ResNet模型在眼底疾病分类中的应用前景广阔。它不仅能够提高疾病诊断的准确性和效率,还能通过可解释AI技术增强医疗专业人员对AI系统的信任。此外,该模型有助于远程监测和远程医疗应用,特别是在资源不足的地区,为患者提供及时的眼科医疗服务。随着技术的进一步发展和临床验证的深入,扩张ResNet模型有望在眼科疾病的诊断、治疗和研究中发挥更大的作用,从而改善患者的治疗结果和整体医疗效果。