基于机器学习算法,利用常规实验室检测预测糖尿病视网膜病变:开启精准诊疗新征程

【字体: 时间:2025年03月19日 来源:European Journal of Medical Research 2.8

编辑推荐:

  为解决糖尿病视网膜病变(DR)早期筛查难题,研究人员用机器学习算法分析数据,发现 XGBoost 模型预测效果佳,助力临床诊疗。

  糖尿病视网膜病变(Diabetic Retinopathy,DR)是糖尿病常见且严重的微血管并发症,堪称工作年龄人群失明的 “头号杀手”。全球有大量糖尿病患者受其困扰,在中国,糖尿病患者数量庞大,其中 2 型糖尿病(Type 2 Diabetes Mellitus,T2DM)患者占比超 90%。DR 早期常悄无声息,一旦进展为威胁视力的 DR(Vision-Threatening Diabetic Retinopathy,VTDR),就可能导致不可逆的视力损伤。虽然早期检测和干预能大幅降低严重视力丧失风险,但当前的 DR 筛查方法困难重重。传统的眼底检查和眼底摄影,要么依赖专业设备和技术,要么成本高昂,导致患者依从性差,在医疗资源匮乏地区,问题更为突出。
为了攻克这些难题,首都医科大学附属北京同仁医院等机构的研究人员开展了一项极具意义的研究。他们的研究成果发表在《European Journal of Medical Research》上。研究旨在找出 DR 的危险因素,并利用 T2DM 患者的常规实验室数据构建基于机器学习(Machine Learning,ML)的预测模型,为临床医生识别高危人群、制定个性化管理策略提供有力支持。

研究人员收集了 2013 年 12 月至 2024 年 4 月北京同仁医院内分泌科 4259 例 T2DM 住院患者的临床数据。这些数据被分为模型构建数据集(3936 例)和外部验证数据集(323 例)。研究用到的主要技术方法有:利用随机森林进行特征选择,从众多变量中筛选出对模型性能影响较大的特征;采用 5 种机器学习算法(XGBoost、支持向量机 Support Vector Machine,SVM、梯度提升决策树 Gradient Boosting Decision Tree,GBDT、神经网络 Neural Network,NN、逻辑回归 Logistic Regression,LR)构建预测模型,并通过 GridSearchCV 方法调整超参数以优化模型性能;运用 Shapley Additive exPlanation(SHAP)方法解释模型决策过程和预测结果,量化各特征对模型预测的贡献。

研究结果如下:

  • 患者特征分析:在模型构建数据集中,DR 患者占 47.69%。与无 DR 患者相比,DR 患者在年龄、T2DM 病程、脉搏、收缩压(Systolic Blood Pressure,SBP)、舒张压(Diastolic Blood Pressure,DBP)等方面水平更高,而体重指数(Body Mass Index,BMI)更低。血液常规、生化和凝血指标也存在差异,如 DR 患者中性粒细胞百分比(NEUT%)、糖化血红蛋白(Glycated Hemoglobin,HbA1c)等指标较高,淋巴细胞百分比(LYMPH%)、白蛋白(Albumin,ALB)等指标较低。
  • 特征选择:经随机森林算法筛选,确定了 39 个最优变量,包括 5 个基本特征、16 个血液常规指标、16 个生化指标和 2 个凝血指标。其中,SBP、纤维蛋白原(Fibrinogen,FIB)、血尿素氮(Blood Urea Nitrogen,BUN)、HbA1c 和丙氨酸氨基转移酶(Alanine Aminotransferase,ALT)等变量对 DR 预测较为重要。
  • 模型性能评估:在内部验证集中,XGBoost 模型表现最佳,AUC 为 0.831,准确率为 0.757,灵敏度为 0.754,特异性为 0.759,F1-score 为 0.752。通过 SHAP 分析发现,生化指标对模型预测贡献最大,SBP、BUN、HbA1c 等是重要预测因素。在外部验证集中,XGBoost 模型的 AUC 为 0.709,准确率为 0.650,虽有所下降,但仍能一定程度上预测 DR 风险。

研究结论和讨论部分意义重大。本研究构建的基于 XGBoost 的预测模型,仅利用常规实验室数据就能有效评估 T2DM 患者的 DR 风险。该模型使用的变量容易获取,可集成到电子健康记录系统中,为基层医院和糖尿病诊所提供了便捷的预测工具,尤其适用于医疗资源不足地区。同时,模型能促使医生和患者重视 DR 的预防,提高高危人群眼底筛查率。然而,研究也存在一些局限性,如可能存在选择偏倚、缺乏纵向研究、外部验证数据集较小等。未来研究可在多中心或纵向研究方面展开,纳入更多临床特征,进一步优化模型,提高对 DR 高危个体的识别率。总体而言,这项研究为 DR 的早期筛查和防治开辟了新路径,有望改善糖尿病患者的健康状况,减少视力损伤的发生。

娑撳娴囩€瑰宓庢导锔炬暩鐎涙劒鍔熼妴濠団偓姘崇箖缂佸棜鍎禒锝堥樋閹活厾銇氶弬鎵畱閼筋垳澧块棃鍓佸仯閵嗗甯扮槐銏狀洤娴f洟鈧俺绻冩禒锝堥樋閸掑棙鐎芥穱鍐箻閹劎娈戦懡顖滃⒖閸欐垹骞囬惍鏃傗敀

10x Genomics閺傛澘鎼isium HD 瀵偓閸氼垰宕熺紒鍡氬劒閸掑棜椴搁悳鍥╂畱閸忋劏娴嗚ぐ鏇犵矋缁屾椽妫块崚鍡樼€介敍锟�

濞嗐垼绻嬫稉瀣祰Twist閵嗗﹣绗夐弬顓炲綁閸栨牜娈慍RISPR缁涙盯鈧鐗哥仦鈧妴瀣暩鐎涙劒鍔�

閸楁洜绮忛懗鐐寸ゴ鎼村繐鍙嗛梻銊ャ亣鐠佹彃鐖� - 濞e崬鍙嗘禍鍡毿掓禒搴n儑娑撯偓娑擃亜宕熺紒鍡氬劒鐎圭偤鐛欑拋鎹愵吀閸掔増鏆熼幑顔垮窛閹貉傜瑢閸欘垵顫嬮崠鏍掗弸锟�

娑撳娴囬妴濠勭矎閼崇偛鍞撮摂瀣鐠愩劋绨版担婊冨瀻閺嬫劖鏌熷▔鏇犳暩鐎涙劒鍔熼妴锟�

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号