
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的膝关节骨质疏松预测模型:创新筛查新方案
【字体: 大 中 小 】 时间:2025年03月17日 来源:BMC Research Notes 2.8
编辑推荐:
研究人员开发基于机器学习和定量超声(QUS)的骨质疏松预测模型,准确率达 88%,助力早期筛查。
在全球老龄化加剧的当下,骨质疏松问题愈发严峻。它就像一个 “沉默的杀手”,悄无声息地侵蚀着人们的骨骼健康,尤其是中老年人。据统计,全球超 4.8 亿人受其困扰,每年因骨质疏松引发的骨折高达 900 多万例,平均每 2.8 秒就有一人骨折。在美国,2010 年骨质疏松的经济负担约 190 亿美元,预计到 2030 年将超 280 亿美元;欧洲地区成本更是高达约 370 亿美元。而在印度、南非等国家,随着老龄化人口增多,相关医疗费用也在不断攀升。
传统上,骨质疏松的诊断依赖双能 X 线吸收法(DXA)测量骨密度(BMD),这一方法长期以来被视为评估骨骼健康的金标准。然而,DXA 扫描成本高昂,需要专业设备和经过培训的人员操作,在中低收入国家难以普及。为了解决这一难题,定量超声(QUS)应运而生,它能通过测量足跟骨估算 T 评分,是一种更经济、便携且易获取的检测方式。
基于此背景,维洛尔理工学院的研究人员开展了一项研究,旨在开发一种基于机器学习的预测模型,利用人口统计学和临床数据,结合 QUS 得出的 T 评分,进行骨质疏松筛查。该研究成果发表在《BMC Research Notes》上。
研究人员使用的主要技术方法如下:
数据来源上,采用来自 Knee X-ray Osteoporosis Database 的开源数据集,包含 3210 名患者记录,涵盖人口统计信息、临床病史和生活方式因素等。在数据处理环节,运用随机抽样方法将患者数据分为训练集(65%)和测试集(35%),并对分类变量进行标签编码和频率编码。针对目标变量类别不平衡问题,采用合成少数过采样技术处理训练集。在特征选择阶段,通过皮尔逊相关系数评估特征间关系,去除部分相关性高的特征,以降低多重共线性,提升模型效率。此外,研究人员部署了四种机器学习模型(XGBoost、AdaBoost、决策树、随机森林)进行对比测试。
研究结果如下:
模型验证:经过超参数调整后,随机森林模型的分类准确率达到 93.8%。在正常分类中,42 人被正确分类为正常骨健康,3 人被误分类为骨质减少;骨质减少分类中,19 人被准确识别,1 人被误分类为正常;骨质疏松分类中,15 人被成功预测,1 人被误分类为正常。
特征重要性:T 评分是影响模型准确性的关键特征,但并非唯一因素。年龄、BMI、绝经状态等其他人口统计学和临床因素同样重要,这些因素综合起来能更全面地评估患者的骨骼健康状况。虽然随机森林模型相比决策树模型分类准确率提高了 10%,但模型复杂性和计算需求增加,在临床应用中需要平衡准确性和可解释性。
人口统计学特征:参与研究的患者中,40.0% 年龄小于 50 岁,60.0% 年龄大于等于 50 岁。吸烟率为 17.08%,99.58% 的患者有一定形式的体育活动,骨折史占 2.08%,27.5% 有骨质疏松家族史。性别分析显示,不同年龄段的男女比例存在差异,女性绝经比例为 34.58% ,18.75% 的患者有甲状腺功能减退或糖尿病等合并症。这些人口统计学特征为针对不同年龄和性别群体制定个性化干预措施提供了依据。
网络和架构:研究提出的系统架构具备可扩展性和可靠性,可实现多医疗机构的实时骨质疏松检测。医疗机构的客户端设备收集患者数据后,通过局域网和 VPN 加密传输至中央服务器,服务器运行骨质疏松检测模型后将结果反馈给医疗机构。生产环境中,应用负载均衡器(ALB)可管理流量,确保系统能处理高流量需求,同时采取防火墙和入侵检测系统(IDS)等安全措施保护数据安全。
研究结论和讨论部分表明,该预测模型可作为骨质疏松初步筛查的有效工具,减少对昂贵且获取受限的 DEXA 扫描的依赖,在医疗领域尤其是资源有限的地区具有重要应用价值。不过,该研究也存在一定局限性,如样本量相对较小、数据来自单一临床中心、模型需在更大规模多中心数据集上进一步验证、仅关注跟骨 QUS 测量而未涉及其他解剖部位等。
总体而言,这项研究为骨质疏松的早期筛查带来了新的希望和方向。未来,通过不断优化模型,纳入更多临床特征,并在更大范围人群中验证,有望让这一技术在全球医疗体系中发挥更大作用,帮助更多人预防和管理骨质疏松,守护骨骼健康。
生物通微信公众号
知名企业招聘