机器学习与逻辑回归预测老年心血管高危人群骨质疏松风险的对比研究及意义

《BMC Geriatrics》:A cross-sectional study comparing machine learning and logistic regression techniques for predicting osteoporosis in a group at high risk of cardiovascular disease among old adults

【字体: 时间:2025年03月30日 来源:BMC Geriatrics

编辑推荐:

  为解决骨质疏松风险预测问题,研究人员开展了对比逻辑回归(LR)与四种机器学习模型预测老年心血管疾病高危人群骨质疏松风险的研究。结果显示 LR 模型表现更优,该研究为骨质疏松风险评估及干预策略制定提供依据。

  骨质疏松,这一无声的 “健康杀手”,正悄然威胁着全球众多人的骨骼健康。它是一种以骨矿物质密度(BMD)降低、骨强度改变和骨折风险增加为特征的全身性代谢性骨病,尤其偏爱老年人,像年长男性和绝经后的女性更是它的 “重点关照对象”。随着全球人口预期寿命的延长,骨质疏松的患病风险人群比例也在显著攀升,据统计,全球约有 2 亿人深受其害,在中国,这一问题同样日益突出,50 岁以上人群患病率达 19.2%,65 岁人群更是高达 32%。
面对如此严峻的形势,精准预测骨质疏松的发病风险并及时进行干预显得尤为重要。然而,骨质疏松的发病机制极为复杂,是多种内外部因素相互作用的结果,这给预测工作带来了巨大挑战。传统的预测方法,如逻辑回归(LR),虽然应用广泛,但面对复杂的疾病机制,它在捕捉各种因素间复杂关系时往往力不从心。随着机器学习(ML)技术的兴起,人们期望借助其强大的数据处理能力和模式识别能力,提高骨质疏松风险预测的准确性。但在特定领域,机器学习算法是否真能超越传统的广义线性模型,仍存在争议。而且,针对心血管疾病高危人群的骨质疏松风险预测研究较少,现有的风险评估模型也存在各种不足,无法满足临床需求。在这样的背景下,中国医科大学附属第一医院的研究人员开展了一项极具意义的研究,该研究成果发表在《BMC Geriatrics》杂志上。

研究人员开展了一项横断面研究,他们从参与低钠盐干预试验(SSaSS)的队列中,随机选取了 6 个村庄(干预组 4 个村,对照组 2 个村)的村民作为研究对象。这些村民均为心血管疾病高危人群,满足相应的纳入和排除标准后,最终共有 211 人参与研究。研究人员收集了参与者的人口统计学、个人行为、医疗行为、生理和血液生化等多方面数据,特别关注了与骨质疏松密切相关的因素,如拷贝数变异(CNV)和低钠盐摄入情况。

研究中用到的主要关键技术方法包括:利用 Epidata 3.1 软件建立数据集;采用双能 X 线吸收法(DXA)测量研究对象的骨密度,依据世界卫生组织(WHO)标准诊断骨质疏松;运用逻辑回归和四种常见的机器学习方法(决策树 DT、随机森林 RF、支持向量机 SVM、极端梯度提升 XGBoost)构建预测模型,并通过校准和区分度指标对比模型性能。

在研究结果部分:

  • 参与者特征:211 名参与者中,男性 92 人(43.60%),女性 119 人(56.40%),平均年龄 66.04±8.60 岁,其中 91 人患有骨质疏松,120 人未患病。研究还发现了 219 个与骨质疏松相关的 CNV,其中 nssv659422 有 134 个重复实例,其余 77 个存在拷贝数变异。
  • 风险因素选择:通过单因素和多因素逻辑分析,确定年龄、性别、BMI、心率、饮酒等因素在单因素分析中有统计学差异,多因素分析显示性别、低钠盐、Tg、中风史和 CNV nssv659422 差异显著(P<0.05) 。
  • 逻辑回归模型的开发与验证:运用逐步回归法构建了名为 Bonepredict 的骨质疏松预测模型,该模型纳入了年龄、性别、葡萄糖、胆固醇、心率、骨折史、中风史、CNV nssv659422、低钠盐等因素。其 AUC 为 0.751,具有良好的校准度(Brier 评分为 0.199)和临床适用性。内部验证结果表明模型稳健性和一致性良好。
  • 不同模型的性能:对比不同模型,逻辑回归模型 AUC 最高(0.751),在预测骨质疏松方面表现最佳,优于其他机器学习模型。与现有骨质疏松风险评估工具相比,Bonepredict 的判别能力更强,校准度更好,净重新分类改善(NRI)和综合判别改善(IDI)更优。

研究结论和讨论部分指出,该研究构建的低钠盐逻辑回归预测模型,能有效预测心血管疾病高危患者的骨质疏松风险。模型综合考虑了遗传(CNV nssv659422)和环境(性别、年龄、甘油三酯水平、心率、中风史、骨折史)等因素,因其可解释性强、适合样本量大小,降低了过拟合风险,为临床决策提供了清晰依据。低钠盐作为预测因素具有创新性,虽目前其与骨质疏松风险的关系尚无定论,但研究为该领域提供了新视角。同时,研究首次将 CNV 纳入预测模型,提高了预测准确性,凸显了整合遗传和临床变量进行风险分层的价值。不过,研究也存在样本量小、模型普适性受限、无法确定因果关系、模型性能有待提高等不足。未来研究可通过多中心纵向研究、随机对照试验等进一步探索,为骨质疏松的预防和管理提供更有力的支持。这项研究为骨质疏松的个性化预防和管理开辟了新道路,有助于临床医生精准识别高危患者,实施针对性干预措施,具有重要的临床意义和科研价值。

涓嬭浇瀹夋嵎浼︾數瀛愪功銆婇€氳繃缁嗚優浠h阿鎻ず鏂扮殑鑽墿闈剁偣銆嬫帰绱㈠浣曢€氳繃浠h阿鍒嗘瀽淇冭繘鎮ㄧ殑鑽墿鍙戠幇鐮旂┒

10x Genomics鏂板搧Visium HD 寮€鍚崟缁嗚優鍒嗚鲸鐜囩殑鍏ㄨ浆褰曠粍绌洪棿鍒嗘瀽锛�

娆㈣繋涓嬭浇Twist銆婁笉鏂彉鍖栫殑CRISPR绛涢€夋牸灞€銆嬬數瀛愪功

鍗曠粏鑳炴祴搴忓叆闂ㄥぇ璁插爞 - 娣卞叆浜嗚В浠庣涓€涓崟缁嗚優瀹為獙璁捐鍒版暟鎹川鎺т笌鍙鍖栬В鏋�

涓嬭浇銆婄粏鑳炲唴铔嬬櫧璐ㄤ簰浣滃垎鏋愭柟娉曠數瀛愪功銆�

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号