探索Dual-Inf:利用大型语言模型实现可解释的差异诊断
摘要
本文介绍了一种名为“Dual-Inf”的创新框架,该框架利用大型语言模型(LLMs)进行可解释的差异诊断(DDx)。该研究的核心目标是自动化生成差异诊断,并提供相应的诊断解释,这对于临床推理和决策支持系统至关重要。论文通过开发一个新的DDx数据集和提出一个新颖的双向推理框架,展示了LLMs在预测不同疾病和提供诊断解释方面的有效性。实验结果表明,Dual-Inf在DDx解释方面相较于基线方法有显著的性能提升,特别是在罕见疾病诊断和解释方面展现出巨大潜力。
原理
Dual-Inf框架的核心在于利用LLMs进行双向推理,即从症状到诊断和从诊断到症状的推理。该框架包括三个主要模块:预测模块、反向推理模块和检查模块。预测模块根据患者的症状描述进行初步诊断;反向推理模块从初步诊断中客观地回忆代表性症状;检查模块接收患者的症状描述和前两个模块的输出,进行正确性检查和决策制定。这种双向推理机制使得模型能够更全面地理解症状与诊断之间的关系,从而提供更准确的诊断和解释。
流程
Dual-Inf的工作流程如下:首先,预测模块利用LLM根据患者的症状描述进行初步诊断。然后,反向推理模块接收这些初步诊断,并回忆与这些诊断相关的代表性症状。最后,检查模块综合患者的症状描述和前两个模块的输出,进行诊断的正确性检查和决策制定。例如,在处理一个关于胸痛的病例时,预测模块可能首先诊断为心脏病,反向推理模块则会回忆与心脏病相关的症状,如胸闷、心悸等,检查模块则根据这些信息进行最终的诊断和解释。
应用
Dual-Inf框架在临床决策支持系统中具有广泛的应用前景。它不仅能够帮助医生快速准确地进行差异诊断,还能提供详细的诊断解释,增强诊断的可信度。特别是在处理罕见疾病时,该框架能够提供更为精确的诊断和解释,有助于减少误诊和漏诊。此外,随着LLMs技术的不断进步,Dual-Inf框架有望进一步优化,提高其在复杂临床场景中的应用效果。
