预测急诊出院后的高住院风险:一种集成学习方法的应用

Predicting Elevated Risk of Hospitalization Following Emergency Department Discharges

摘要

本文由Dat Hong, Philip M. Polgreen和Alberto Maria Segre共同撰写,聚焦于预测急诊部门出院后短期内(3天、7天和14天)的住院风险。文章通过数据挖掘技术,利用大型医院数据集,构建了高准确度的预测模型。该模型结合了逻辑回归、朴素贝叶斯和关联规则分类器,旨在帮助医生在急诊部门环境中预测患者早期入院的风险,从而提高患者安全和医疗服务质量。

原理

本文采用了一种集成学习方法,结合了逻辑回归(LR)、朴素贝叶斯(NB)和关联规则分类(ARC)三种算法。逻辑回归通过学习数据中的特征权重来预测二元响应的概率,其优势在于简单且易于解释。朴素贝叶斯假设各输入特征独立,通过计算条件概率来进行分类。关联规则分类则通过挖掘频繁项集来生成分类规则,这些规则基于特征的共现频率和支持度。集成学习通过组合这些分类器的输出,进一步提高了预测的准确性和稳定性。

流程

研究首先从2009年加州医疗成本和利用项目(HCUP)数据库中提取数据,筛选出5,487,722次急诊访问记录。随后,通过特征选择和编码,将原始数据转换为适合机器学习处理的格式。接着,使用训练数据集训练LR、NB和ARC分类器,并通过验证数据集调整模型参数。最后,利用测试数据集评估模型的性能,确保预测结果的准确性和可靠性。

应用

该预测模型具有广泛的应用前景,特别是在急诊部门中,可以帮助医生识别高风险患者,从而做出更合适的出院或入院决策。此外,该模型还可用于优化资源分配,如对高风险患者进行更密切的后续跟踪,减少不必要的再入院,提高医疗服务的整体效率和患者满意度。