创新的多标签与多头部注意力机制:提升肺呼吸音分类的轻量级解决方案
摘要
本文旨在开发一种辅助诊断系统,用于分类异常肺呼吸音,通过创新的多标签学习方法和多头部注意力机制提高自动异常呼吸音分类的准确性。针对现有呼吸音数据集的类别不平衡和缺乏多样性的问题,研究采用轻量级且高度准确的模型,使用二维标签集来表示多种呼吸音特征。该方法在ICBHI2017数据集上的四分类任务中达到了59.2%的ICBHI评分,展示了其在轻量级和高准确性方面的优势。本文不仅提高了肺呼吸音异常自动诊断的准确性,还为临床应用开辟了新的可能性。
原理
本文提出的方法通过结合多标签学习和多头部注意力机制,有效地解决了呼吸音分类中的类别不平衡和数据多样性不足的问题。多标签学习允许每个呼吸音样本关联多个类别标签,从而减少了模型训练中的收敛混淆。多头部注意力机制则通过不同的注意力头捕捉不同层次的特征,提高了模型对关键特征的识别能力。此外,研究还探索了可学习的频谱前端模块对模型性能的影响,通过学习自适应的滤波器来优化特征提取过程。
流程
研究首先收集并预处理呼吸音数据,将其转换为适合模型输入的频谱图或通过可学习的前端架构进行特征提取。接着,使用轻量级模型进行训练,并在分类器中集成多标签方法和多头部注意力机制。最后,通过多次测试验证不同模型和方法的性能,包括模型比较、预训练效果验证、注意力机制集成和多标签方法的有效性。例如,在ICBHI2017数据集上,通过多标签方法和多头部注意力机制的结合,CNN6架构的模型性能显著提升。
应用
本文提出的方法不仅适用于肺呼吸音的自动分类,还可扩展到其他医疗声音的分类任务,如心脏音、肠道音等。随着深度学习技术在医疗领域的广泛应用,该方法有望成为临床诊断的重要辅助工具,特别是在快速评估大量患者或进行长期药物效果监测的场景中。此外,该方法的轻量级设计也使其适合集成到便携式医疗设备中,如电子听诊器,从而提高其在实际临床环境中的可用性。
