《BMC Geriatrics》:Network-based predictive models for artificial intelligence: an interpretable application of machine learning techniques in the assessment of depression in stroke patients
编辑推荐:
研究人员为预测脑卒中患者抑郁风险,用机器学习构建模型,XGBoost 模型效果佳,辅助临床判断。
# 机器学习助力脑卒中患者抑郁风险预测:开启精准医疗新篇章
在日常生活中,脑卒中(俗称 “中风”)并不罕见,它不仅会严重损害患者的身体机能,还可能在患者的心灵上蒙上一层阴影 —— 抑郁。据研究表明,约 30% 的脑卒中患者在发病后的五年内会受到抑郁的困扰,这一比例远远高于普通人群。抑郁的症状,如持续的悲伤情绪、对事物失去兴趣、疲劳感加剧、睡眠紊乱以及注意力难以集中等,不仅会让患者的情绪陷入低谷,还会阻碍他们的康复进程,降低生活质量,甚至增加复发中风和死亡的风险。更糟糕的是,抑郁还会使患者在康复治疗过程中缺乏积极性和依从性,进一步影响治疗效果。因此,如何早期、准确地识别脑卒中患者的抑郁风险,成为了亟待解决的重要问题。
在此背景下,来自上海理工大学和上海市浦东新区公利医院神经内科的研究人员 Wenwei Zuo 和 Xuelian Yang 开展了一项具有重要意义的研究。他们的研究成果发表在《BMC Geriatrics 》杂志上,旨在开发并验证一种可解释的预测模型,利用机器学习(ML)方法评估脑卒中患者的抑郁风险。
研究人员使用了美国国家健康和营养检查调查(NHANES)2005 - 2020 年的数据集,该数据集涵盖了广泛的非机构化平民人口信息。在研究过程中,他们运用了多种关键技术方法。首先,通过对数据进行预处理,排除了存在缺失数据的个体,并将数据集按照 7:3 的比例随机分为训练集和测试集。接着,利用单变量和多变量逻辑回归分析确定脑卒中患者抑郁的风险因素。然后,采用五种机器学习算法(随机森林(RF)、决策树(DT)、极端梯度提升(XGBoost)、朴素贝叶斯(NB)和支持向量机(SVM))构建预测模型,并使用多种评估指标(如受试者工作特征曲线(ROC)下的面积(AUC)、平均精度得分(APS)等)对模型性能进行评估。此外,研究人员还运用了 Shapley 加性解释(SHAP)方法对模型进行解释,分析各个特征的重要性。
下面来看看具体的研究结果:
1. 参与者基线特征
研究共纳入 1143 名参与者,训练集有 806 人,测试集有 337 人。整体样本的中位年龄为 67 岁,男性占 49.17%,女性占 50.83%,其中 200 人被诊断为抑郁。训练集和测试集在各变量上均无统计学显著差异,这为后续模型的构建和评估提供了可靠的基础。
2. 机器学习模型的构建
经过单变量逻辑回归分析,发现有 14 个变量与脑卒中患者抑郁风险相关。进一步的多变量逻辑回归分析最终确定了七个显著的预测因素,分别是:女性(相比男性,患抑郁风险增加,优势比(OR):1.814,95% 置信区间(CI):1.142 - 2.883);年龄(与抑郁风险呈负相关,OR:0.977,95% CI:0.961 - 0.993);贫困收入比(PIR,与抑郁风险呈负相关,OR:0.829,95% CI:0.701 - 0.993);饮酒(增加抑郁风险,OR:1.976,95% CI:1.143 - 3.415);睡眠障碍(显著增加抑郁风险,OR:3.390,95% CI:2.179 - 5.272);适度的娱乐活动(与抑郁风险呈负相关,OR:0.503,95% CI:0.299 - 0.846);总胆固醇(TC,与抑郁风险呈正相关,OR:1.215,95% CI:1.023 - 1.445)。随后,研究人员将这七个变量纳入五种机器学习模型进行分析。
3. 机器学习模型的性能测试
测试结果显示,在五种模型中,XGBoost 模型表现最为出色。其 AUC 值达到 0.746(95% CI:0.674 - 0.810) ,高于其他模型(RF 的 AUC 为 0.711,DT 为 0.719,NB 为 0.671,SVM 为 0.703)。XGBoost 模型的准确率为 0.834,平均精度得分(APS)为 0.353,在识别脑卒中患者抑郁风险方面展现出了较高的精度和稳健性。
4. 特征重要性的可视化
通过 SHAP 算法对 XGBoost 模型进行分析,结果表明睡眠障碍在所有特征中平均预测能力最强,其次是年龄、PIR、适度娱乐活动、TC、性别和饮酒。这一分析结果直观地展示了各个特征对模型预测的影响程度,有助于深入理解模型的决策过程。
5. 临床应用 的便利性
为了方便临床应用,研究人员基于 Streamlit 框架开发了一个网络应用程序。只需输入模型所需的七个特征的实际值,该应用程序就能自动预测脑卒中患者患抑郁的风险,并展示单个患者的特征图,清晰地呈现影响抑郁预测的关键因素,为临床医生提供了便捷的评估工具。
在研究结论与讨论部分,该研究构建的基于 XGBoost 算法的预测模型,在预测脑卒中患者抑郁风险方面表现出良好的性能。通过 SHAP 方法对模型进行解释,提高了模型的可解释性,让临床医生能够更好地理解模型的预测依据,从而更有针对性地对高风险患者进行干预。同时,研究也发现了多个与脑卒中患者抑郁风险相关的因素,为进一步的临床研究和干预措施的制定提供了重要参考。
然而,研究也存在一些局限性。例如,研究采用的是横断面设计,无法确定变量之间的因果关系;数据依赖于受访者的主观判断和记忆,可能存在信息不准确或不完整的情况;数据集可能未涵盖某些关键混杂因素,影响预测准确性;研究未进行外部验证,模型在不同临床特征患者群体中的适用性和可靠性有待进一步确认。
尽管如此,这项研究依然为脑卒中患者抑郁风险的预测和干预提供了新的思路和方法。未来,研究人员可以在这些基础上,通过开展纵向研究或随机对照试验,采用更客观的测量工具,完善数据集,进行外部验证等方式,进一步优化模型,提高其准确性和可靠性,为改善脑卒中患者的心理健康和生活质量做出更大的贡献。
打赏
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
欢迎下载Twist《不断变化的CRISPR筛选格局》电子书
单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析
下载《细胞内蛋白质互作分析方法电子书》