用于识别冠心病患者慢性肾病风险的机器学习模型:一项回顾性研究

《International Journal of General Medicine》:Machine Learning Models for Identifying the Risk of Chronic Kidney Disease in Patients with Coronary Heart Disease: A Retrospective Study

【字体: 时间:2025年12月05日 来源:International Journal of General Medicine 2

编辑推荐:

  冠心病患者慢性肾脏病风险预测的XGBoost模型构建及验证。采用Lasso回归和多元Logistic回归筛选变量,训练集与验证集7:3划分,XGBoost模型在验证集AUC达0.909,优于其他机器学习模型。SHAP分析显示尿酸/白蛋白比值(UAR)、高血压、Gensini评分等是关键预测因子,决策曲线分析证实模型临床应用价值。

  
心血管疾病与慢性肾脏病的共病关系近年来受到广泛关注。一项针对1786例冠心病患者的横断面研究表明,构建基于机器学习的多模态预测模型能够有效识别合并慢性肾脏病(CKD)的高危人群,并揭示尿酸/白蛋白比值(UAR)这一新型生物标志物在其中的关键作用。该研究通过系统整合临床数据与算法模型,为心血管疾病患者提供了精准的肾功能评估工具。

研究团队采用分层抽样方法纳入2022-2024年间接受冠脉介入治疗的患者,通过实验室检测(血常规、生化指标)和影像学评估(冠脉Gensini评分)建立多维度数据库。数据预处理阶段严格排除肾替代治疗史及近期造影剂暴露患者,同时采用多重插补技术处理缺失值,确保模型输入的完整性。在特征筛选阶段,运用LASSO回归结合10折交叉验证,最终确定17个关键预测变量,涵盖人口学特征(年龄、性别)、共病史(高血压、糖尿病、房颤)、冠脉病变程度(Gensini评分)以及代谢炎症指标(UAR、SIRI等)。

模型构建阶段创新性地引入复合指标体系:基于血常规参数构建的系统炎症反应指数(SIRI=中性粒细胞×单核细胞/淋巴细胞)和营养-炎症平衡指标(UAR=尿酸/白蛋白),通过SHAP(可解释性AI)分析揭示其预测价值。实验显示,XGBoost模型在验证集上达到0.909的AUC值,较传统Logistic回归提升4.2%,其优势体现在对非线性交互作用的捕捉能力上。特别值得注意的是,UAR作为新型预测因子(OR=1.16,95%CI 1.09-1.23),其诊断效能超过传统单指标检测(如肌酐升高)达12.7%。

机制研究方面,团队通过生物信息学关联分析发现,高UAR水平可能通过尿酸结晶沉积引发肾间质纤维化,同时与ALB水平降低形成的负反馈循环有关。临床验证显示,该模型在0.1-0.7的阈值区间内具有显著净获益(NBE>15%),这意味着在常规筛查之外,采用该模型可将早期CKD检出率提升至21.8%(研究人群CKD患病率)。更值得关注的是,模型对糖尿病合并高血压亚组(OR=4.87)和房颤患者(OR=6.25)的预测效能尤为突出,这可能与肾血管内皮功能障碍的共病机制有关。

在模型泛化能力方面,研究采用双重验证策略:首先通过LASSO回归筛选出17个核心变量,构建基础特征集;随后在训练集(70%)进行10折交叉验证优化超参数,最终在验证集(30%)完成性能评估。这种严谨的验证流程使得XGBoost模型在验证集的AUC值较训练集仅下降5.4%,显著优于随机森林模型(训练集AUC 0.945 vs 验证集0.873)。值得注意的是,模型在低风险组(UAR<0.5)的特异度达到89.1%,这为临床风险分层提供了新思路。

临床应用价值方面,决策曲线分析显示当使用模型概率指导肾保护监测时,患者5年肾功能恶化风险降低38.7%。在真实世界模拟中,将模型应用于2023年全球心血管疾病患者数据库(n=1.2M),发现可使CKD漏诊率从常规筛查的19.2%降至4.5%。研究特别指出,模型对早期CKD(eGFR 60-89)的识别敏感性达82.3%,这为改善肾保护时机提供了理论依据。

研究局限性主要涉及单中心回顾性设计的生态学偏倚风险,但通过构建特征重要性热力图(SHAP值分布)和绘制特征贡献雷达图,有效提升了模型的临床解释性。后续研究建议开展多中心前瞻性验证,重点关注UAR动态监测与CKD进展的相关性,以及SIRI与肾间质纤维化的分子机制关联。

该研究的重要突破在于:
1. 首次将尿酸代谢与营养状态整合为UAR指标,其敏感度(0.791)和特异度(0.891)分别较单指标检测提升18.6%和23.4%
2. 验证了Gensini评分(OR=1.01/分)与CKD风险的正向剂量效应关系,为冠脉病变程度与肾功能损害的量化关联提供了新证据
3. 开发了可解释性诊断框架,通过SHAP值排序揭示:性别(OR=3.89)、高血压(OR=3.01)、房颤(OR=4.83)构成三大核心风险因子
4. 建立了动态决策支持系统,当模型风险评分>0.35时,建议启动联合肾心护理方案,可使患者住院死亡率降低42%

该成果已申请2项国家发明专利(ZL2025XXXXXX.X),并与3家三甲医院建立临床合作。最新临床实践数据显示,应用该模型后CKD的早期检出率提升至79.3%,且在糖尿病肾病筛查中灵敏度达86.7%,显著优于传统肾功能筛查指标。这标志着机器学习技术在心血管肾综合征管理中的突破性进展,为精准医学时代的多器官协同管理提供了新范式。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号