创新心音分类技术:MBDCN与LSCN模型的高效诊断应用
摘要
本文介绍了一种快速且成本效益高的方法,用于在临床环境中使用低成本系统诊断心脏异常,具有高准确性和可靠性。主要挑战是自动诊断心脏疾病时正确和可接受的标记样本的稀缺性,这可能导致准备成本高昂。为解决这一问题,本文提出了两种方法:第一种是受人类听觉处理启发的独特多分支深度卷积神经网络(MBDCN)架构,通过使用不同大小的卷积滤波器和音频信号功率谱作为输入来优化特征提取。第二种方法称为长短期记忆-卷积神经(LSCN)模型,该网络架构包括长短期记忆(LSTM)网络块,以改善时间域中的特征提取。实验结果显示,所提出的方法在心音分类任务中优于现有技术,总体分类准确率超过96%。
原理
本文提出的MBDCN和LSCN模型通过结合多个并行分支,每个分支包含一维卷积层和LSTM块,有效地处理音频信号。MBDCN模型通过使用不同大小的卷积滤波器和音频信号的功率谱作为输入,优化特征提取。LSCN模型在MBDCN的基础上增加了LSTM块,进一步提高了时间域的特征提取能力。这种结合使得模型能够更好地理解和分类音频信号,特别是在处理心脏声音信号时,能够更准确地识别和分类心脏异常。
流程
- 使用Welch方法的周期图作为输入,减少PCG信号的噪声和方差。
 - 将功率谱输出平滑并转换为4D张量,作为网络的输入张量。
 - MBDCN模型通过四个并行分支的卷积层提取特征,通过深度连接层形成单一特征向量。
 - 特征向量通过卷积层和全连接层,最终通过SoftMax层产生输出。
 - LSCN模型在MBDCN的基础上增加LSTM层,进一步提取时间域特征,并通过全连接层进行分类。
 
应用
所提出的方法在自动分析心音和早期检测心血管疾病方面显示出巨大的潜力。其高准确性和效率使其在临床诊断和早期筛查中具有广泛的应用前景。此外,该方法还可以扩展到其他音频信号处理任务,如语音识别和环境声音分类。
