基于机器学习构建婴儿遗传性胆汁淤积性疾病的早期预测模型:JADE-B系统的开发与验证

【字体: 时间:2025年08月04日 来源:Journal of Pediatric Gastroenterology and Nutrition 2.6

编辑推荐:

  这篇研究创新性地开发了名为JADE-B(Jaundice Diagnosis Easy for Baby)的机器学习模型,通过整合47项临床和实验室参数(最终优化为20项早期指标),实现对婴儿遗传性胆汁淤积疾病的早期预测(AUC达0.869-0.884)。该模型采用XGBoost、LightGBM等算法,能有效优化基因检测资源分配,为临床决策提供数据支持。

  

Abstract

婴儿胆汁淤积症是儿科肝病领域的复杂临床难题,涉及100余种遗传性和获得性病因。传统诊断方法面临病因多样性(如PFIC、Alagille综合征等)和基因检测资源有限的矛盾。本研究通过机器学习技术构建JADE-B预测系统,为遗传性胆汁淤积的早期识别提供创新解决方案。

Methods

研究团队从2006-2018年台湾大学附属医院数据库筛选1845例患者,最终纳入1008例1岁以下胆汁淤积患儿(直接胆红素>1.0 mg/dL或总胆红素>1.5 mg/dL)。采用47项参数(包括出生体重、GGT、AST/ALT动态变化等)训练4种算法:逻辑回归、XGBoost、LightGBM和随机森林。通过特征选择优化后,开发5组预测模型(Model 1-5),其中Model 5(JADE-B核心模型)仅需20项1个月内可获取的临床指标。

Results

关键发现包括:

  1. 遗传组患儿呈现显著更高的D-Bil(12月龄1.90 vs 0.87 mg/dL,p=0.008)、ALT(6月龄p=0.0028)和AST(3月龄p=0.018)水平

  2. 最佳模型AUC达0.884(Model 2),而临床实用的JADE-B模型(Model 5)仍保持0.836的AUC

  3. SHAP分析揭示早发年龄、低出生体重和肠外营养(PN)使用与遗传性疾病呈负相关

  4. 外部验证(韩国、泰国98例)显示0.712的AUC

Highlights

• 创新性:首次将ML应用于婴儿胆汁淤积的基因检测优先级排序

• 临床价值:可减少78.2%非必要基因检测,阳性预测值24.2%

• 技术突破:整合时序性肝功能数据(如GGTp3m)提升预测精度

Conclusions

JADE-B系统通过机器学习算法实现了:

  1. 早期识别需优先进行WES/WGS检测的高危患儿

  2. 优化医疗资源配置,特别适合资源有限地区

  3. 为个性化治疗策略提供数据支持

该模型未来可通过前瞻性多中心研究进一步验证,并有望扩展至其他遗传性肝病的预测领域。研究团队已开发在线应用平台(https://gi-genetic-predictor.streamlit.app/)供临床试用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号