优化心脏病诊断:先进机器学习模型的预测性能比较

【字体: 时间:2025年03月23日 来源:BMC Cardiovascular Disorders 2

编辑推荐:

  为精准预测心脏病,研究人员对比多种机器学习模型,发现集成方法效果佳,助力疾病诊断。

  心血管疾病(Cardiovascular diseases,CVDs)是全球范围内的 “健康杀手”,每年夺走无数生命 。想象一下,在医院里,医生们面对众多可能患有心脏病的患者,却缺乏精准且快速的预测工具,难以在疾病早期就发现并干预,导致许多患者错失最佳治疗时机,病情恶化 。这不仅给患者带来巨大痛苦,也让医疗系统承受沉重负担。为了打破这一困境,来自印度韦洛尔科技大学(Vellore Institute of Technology)的研究人员展开了一项意义重大的研究,相关成果发表在《BMC Cardiovascular Disorders》上。
研究人员运用了多种关键技术方法。他们从 UC Irvine 机器学习库和 Kaggle 获取心脏病数据集,该数据集整合了来自克利夫兰、瑞士、匈牙利、长滩和 Statlog 的资料,包含 1190 条记录和 12 个特征。之后,研究人员精心挑选了 7 个关键特征,并将数据集按 8:2 的比例划分为训练集和测试集。接着,运用 15 种机器学习模型对数据进行分析,通过准确率、精确率、召回率、F1 分数、混淆矩阵和 ROC-AUC(受试者工作特征曲线下面积)等指标评估模型性能,还采用 K 折交叉验证(K = 10 和 K = 5)来确保模型的稳健性和泛化能力。

研究结果主要包含以下几个方面:

  • 特征选择:通过对心脏病数据集的相关性矩阵分析发现,年龄与静息血压、运动诱发心绞痛存在中度相关性,年纪大的人运动时血压可能更高、更易出现心绞痛;男性患心脏病的可能性更高;胸痛类型与运动诱发心绞痛、目标变量紧密相关,对心脏病诊断意义重大;最大心率与年龄、目标变量呈显著负相关;运动诱发心绞痛、ST 段斜率和旧峰(old peak)与目标变量正相关。基于这些发现,研究人员选择了 7 个特征用于后续机器学习分析。
  • 评估机器学习模型:不同机器学习模型表现各异。逻辑回归(Logistic regression)准确率为 0.83,精确率 0.84,召回率 0.78,F1 分数 0.81;随机森林(Random Forest)表现出色,准确率达 0.91,精确率 0.92,召回率 0.90,F1 分数 0.91;支持向量机回归(SVM regression)与逻辑回归结果相近;K 近邻(KNN)虽准确率与随机森林相同,但交叉验证时准确率大幅下降,可能存在过拟合;XGBoost 表现最佳,准确率 0.93,精确率 0.92,召回率 0.92,F1 分数 0.92;袋装树(Bagged Tree)与 XGBoost 表现相当,准确率也为 0.93。
  • ROC-AUC:随机森林和袋装树的 ROC-AUC 值最高,达 0.95,表明它们区分心脏病患者和非患者的能力最强;XGBoost 的 ROC-AUC 值为 0.94;梯度提升机(GBM)为 0.92;而传统模型如逻辑回归、多元自适应回归样条(MARS)等 ROC-AUC 值为 0.90,整体表现稍逊一筹。
  • 混淆矩阵:随机森林、XGBoost 和袋装树在预测心脏病方面优势明显,误分类率低,在混淆矩阵中展现出最佳准确率;KNN、GBM 和神经网络表现良好;逻辑回归、SVM、灵活判别分析(FDA)等模型表现不错但错误率较高;条件推理树(CIT)、贝叶斯广义线性模型(BGLM)和提升广义线性模型(BGGLM)准确率较低,还需优化。
  • 交叉验证:XGBoost 和袋装树在交叉验证中的最高准确率为 93%,随机森林和 KNN 为 91%。随机森林在交叉验证中表现稳定,K = 10 时准确率 94%,K = 5 时 92%;XGBoost 则稍有下降;KNN 准确率大幅下降,进一步证实其可能过拟合;传统模型表现较为稳定。

研究结论和讨论部分指出,与以往研究相比,此次研究选用部分特征和先进机器学习算法,显著提高了预测准确率。XGBoost 和袋装树准确率达 93%,随机森林和 KNN 为 91%,且计算了以往研究未涉及的 ROC-AUC 值,全面评估了模型性能。研究还指出了以往研究的局限性,如未充分评估特征影响、对比模型有限、缺乏 ROC-AUC 分析、模型验证不足以及未考虑模型实际应用等。未来研究可探索生存分析模型,如高斯过程回归;尝试混合模型方法;将模型应用于临床决策支持系统;使用更大规模的真实世界数据集进行验证。这些研究成果为心脏病的预测提供了更可靠的方法,有助于医生更准确地诊断疾病,改善患者的治疗效果,推动了心脏病诊断领域的发展,也为后续研究指明了方向。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号