机器学习模型预测早产儿视网膜病变(ROP)发展及治疗需求的研究意义

《BMC Ophthalmology》:Prediction of retinopathy of prematurity development and treatment need with machine learning models

【字体: 时间:2025年04月11日 来源:BMC Ophthalmology 1.7

编辑推荐:

  为解决 ROP 筛查效率低等问题,研究人员开展用机器学习(ML)模型预测 ROP 发生及治疗需求的研究。结果显示,模型预测平衡准确率达 80% 左右。这能助力 ROP 筛查和临床决策,提高诊疗水平。

  在新生儿的世界里,有一种疾病如同隐藏的 “视力杀手”,悄然威胁着早产儿的光明未来,它就是早产儿视网膜病变(Retinopathy of Prematurity,ROP)。ROP 是全球范围内导致儿童失明的重要可预防原因之一。据统计,2010 年约有 184,700 名早产儿被诊断出患有 ROP,其中约 20,000 例最终失明 。ROP 的发生与出生体重(Birth Weight,BW)和胎龄(Gestational Age,GA)密切相关,体重越低、胎龄越小,患病风险越高。在新生儿护理不断进步、早产儿存活率上升的当下,ROP 的高效筛查和及时干预变得愈发关键。
然而,目前的 ROP 筛查面临诸多挑战。在高收入国家,频繁的眼部检查(每周或每两周一次)不仅需要专业的医疗团队,还会给新生儿带来身体不适、疼痛,甚至增加呼吸暂停的风险。对于资源有限的地区,眼底成像设备的匮乏更是让筛查工作困难重重。传统的基于眼底彩色照片(Color Fundus Photographs,CFP)的诊断方法虽然准确性较高,但在预测疾病进展方面存在局限。而现有的临床数据预测模型,如 DIGIROP-Birth、Colorado-ROP 等,虽然纳入了一些关键因素,但仍有改进空间。因此,开发一种更高效、广泛适用且资源友好的 ROP 预测模型迫在眉睫。

为了攻克这一难题,来自伊兹密民主大学布卡?塞菲?德米尔索伊教育与研究医院眼科、多库兹?埃尤尔大学等机构的研究人员,开展了一项极具意义的研究。他们旨在评估基于人口统计学和临床数据构建的机器学习(Machine Learning,ML)模型,在预测 ROP 发生和治疗需求方面的能力。该研究成果发表在《BMC Ophthalmology》杂志上。

研究人员采用了回顾性队列研究方法,对 2015 年 10 月至 2023 年 10 月在多库兹?埃尤尔大学医院眼科接受 ROP 筛查的早产儿病历进行了详细回顾。研究对象严格遵循土耳其 ROP 筛查指南选取,包括胎龄 34 周及以下、出生体重 1700g 及以下的早产儿,以及接受心肺支持或被新生儿科医生认为有 ROP 风险的早产儿 。研究排除了数据缺失、患有家族性渗出性玻璃体视网膜病变(Familial Exudative Vitreoretinopathy,FEVR)、已知代谢疾病、染色体异常或其他先天性眼部异常的婴儿。

在构建 ML 模型时,研究人员选取了 49 个标准特征,涵盖人口统计学信息、实验室检查数据等。其中,模型 I 和 II 利用出生后 24 小时内的数据,分别用于预测 ROP 发生和治疗需求;模型 III 和 IV 则使用首次 ROP 筛查时的数据进行同样的预测。研究借助 Python 平台的 Jupyter Lab,利用 Sci-kit 库实现算法,对数据进行预处理,并将数据集随机划分为训练集(85%)和测试集(15%)。为了确保模型的可靠性,研究采用了 5 种不同的分类器算法,包括决策树(Decision Tree,DT)、随机森林(Random Forest,RF)、逻辑回归(Logistic Regression,LR)、支持向量机(Support Vector Machine,SVM)和极端梯度提升(Extreme Gradient Boosting,XGBoost)。同时,运用合成少数过采样技术(Synthetic Minority Over-sampling Technique,SMOTE)处理不平衡数据,并通过 5 折交叉验证评估模型的泛化能力。

研究结果令人瞩目。在 355 名早产儿的队列中,模型 I 预测 ROP 发生的平衡准确率达到 80%,GA、BW 和平均红细胞体积(Mean Corpuscular Volume,MCV)是最重要的预测参数;模型 II 预测治疗需求的平衡准确率为 81%,关键预测参数包括低 GA、BW、1 分钟和 5 分钟 Apgar 评分以及低红细胞计数。模型 III 预测 ROP 发生的平衡准确率为 80%,模型 IV 预测治疗需求的平衡准确率为 66%,BW、每日体重增加(Daily Weight Gain,DWG)、总氧支持时间和血小板 / 淋巴细胞比值在这两个模型中是重要的预测参数 。

在讨论部分,研究人员指出,ML 模型在预测 ROP 方面展现出巨大潜力,平衡准确率达到 80% 左右,这一成绩在疾病患病率较低的情况下尤为难得。研究发现,BW 和 GA 是 ROP 发展的主要预测因素,同时一些血常规(Complete Blood Count,CBC)参数,如 MCV、红细胞计数和血红蛋白,也与 ROP 的发生密切相关。此外,较低的 Apgar 评分、较长的新生儿重症监护病房(Neonatal Intensive Care Unit,NICU)住院时间和氧支持时间,均与 ROP 的发生和治疗需求相关。

与其他研究相比,该研究纳入了更广泛的风险因素,包括 CBC 参数、血气分析结果等,且未排除胎龄 32 周后的婴儿,使模型更具实用性和普遍性。尽管研究存在样本量不平衡、缺乏外部验证等局限性,但它为未来的研究指明了方向。研究人员认为,未来应开展多中心研究,进一步评估不同医疗环境下的 ROP 发病率和治疗阈值,探索流行病学差异对 ML 模型性能的影响,并验证模型在不同人群中的有效性。

这项研究意义重大,它表明 ML 模型能够有效处理复杂的临床数据,预测 ROP 的发生和治疗需求,为临床医生提供了有价值的决策支持。虽然眼底检查仍是 ROP 诊断的金标准,但 ML 模型可作为辅助工具,提高筛查效率,减少不必要的检查,让医疗资源得到更合理的分配,为守护早产儿的视力健康开辟了新的道路。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号