机器学习助力 HELLP 综合征精准诊断:开启孕期健康新征程

【字体: 时间:2025年03月18日 来源:BMC Medical Informatics and Decision Making 3.3

编辑推荐:

  为解决 HELLP 综合征诊断难题,研究人员开展预测模型研究,发现 ML 算法有效,意义重大。

  

HELLP 综合征诊断困境催生机器学习探索之旅

在女性孕期的健康风险中,HELLP 综合征犹如一颗隐藏的 “定时炸弹”,令人担忧。它首次于 1982 年被报道,是一种罕见且发病突然的并发症,主要表现为溶血(Hemolysis)、肝酶升高(Elevated Liver Enzymes)和血小板计数降低(Low Platelet Count)这三大症状,全球约 0.2 - 0.6% 的妊娠会受其影响。由于目前其病因和发病机制尚未完全明晰,将它与其他妊娠相关疾病区分开来极为困难。而且一旦诊断延迟,治疗也会跟着滞后,这不仅给疾病管理带来巨大挑战,还可能引发一系列严重后果,像血管内凝血、胎盘早剥、肺水肿、视网膜脱离,甚至导致母婴死亡。因此,及时准确地诊断 HELLP 综合征对保障母婴生命安全至关重要。
过往的相关研究存在诸多局限,样本量有限,对患者不良预后的预测因素也缺乏全面的探究。尽管一些算法尝试利用孕妇早期的生化和临床变化来预测妊娠中毒,但至今仍未找到能精准预测 HELLP 综合征的有效算法。鉴于此,来自伊朗德黑兰的研究人员决心开启一场探索之旅,利用数据挖掘技术开发预测 HELLP 综合征的模型,为临床诊断提供新的有力武器。该研究成果发表在《BMC Medical Informatics and Decision Making》杂志上。

多技术融合:解锁数据密码的 “钥匙”

为了攻克 HELLP 综合征诊断难题,研究人员精心设计了一套研究方案。首先,通过全面的文献回顾和专家访谈确定数据元素。他们借助多个电子数据库,如科学信息数据库(SID)、PubMed、Scopus、Web of Science、Medline 和 Google Scholar 搜索引擎,广泛查阅相关资料,再结合与产科专家的面对面访谈,最终确定了 21 个用于研究的变量。
接着,研究人员收集了伊朗德黑兰 Shohadaye Tajrish 医院 2010 - 2021 年 384 名孕妇的记录,这些数据涵盖了孕妇的人口统计学信息、病史、检查结果等多方面内容。由于收集到的数据集存在类别不平衡的问题,研究人员采用合成少数过采样技术(SMOTE)对数据进行预处理,使数据集更加均衡,为后续分析奠定基础。
最后,研究人员运用 Python 编程语言,对 9 种机器学习(ML)算法进行研究和比较。这些算法包括基于网络的算法(多层感知器 MLP 和深度学习 DL)、集成算法(随机森林 RF、XGBoost 和 AdaBoost)以及经典算法(决策树 DT、支持向量机 SVM、逻辑回归 LR 和 K 近邻 KNN)。他们使用留出法(将数据集分为 70% 的训练集和 30% 的测试集)和 k 折交叉验证法(k = 5 和 k = 10)对模型进行验证,通过计算准确率、精确率、灵敏度、F1 分数和 AUC 等评估指标,筛选出最佳算法。

研究结果:机器学习算法表现卓越,关键因素浮出水面

经过一系列严谨的研究分析,研究人员收获了许多重要成果。在模型性能方面,不同算法在不同验证方法下各有表现。在留出交叉验证法中,MLP 算法表现最佳,F1 分数达到 0.994;在 5 折和 10 折交叉验证法中,DL 算法脱颖而出,F1 分数分别为 0.989 和 0.993。此外,KNN、RF、AdaBoost、XGBoost 和 LR 在所有三种评估场景下,F1 分数均超过 0.95,而 SVM 的 F1 分数约为 0.90,DT 的 F1 分数最低,低于 0.90。这表明除 DT 外,其他算法在预测 HELLP 综合征方面都具有较高的可靠性。
在影响诊断的关键因素分析中,研究发现血小板计数、孕周和丙氨酸转氨酶(ALT)等变量在诊断 HELLP 综合征中最为重要。在基线特征里,孕周的重要性位居前列,其次是母亲年龄;而双胞胎、流产次数等因素对预测模型影响较小。临床特征方面,恶心和舒张压对建模影响显著,头痛、上腹痛和收缩压则影响不大。生物标志物特征中,血小板是最重要的因素,此外,天冬氨酸转氨酶(AST)、空腹血糖(FBS)、直接胆红素(Bili D)、肌酐(CR)、乳酸脱氢酶(LDH)和总胆红素(Bili T)等也有重要影响,只有 ALT 对建模无明显影响。总体而言,生物标志物特征在诊断疾病方面比其他类别特征更为有效。

研究结论与意义:为临床诊断点亮新希望

这项研究意义非凡。它成功表明 ML 算法可有效用于开发 HELLP 综合征诊断模型,多种算法在不同验证方法下都展现出较高的性能,为临床诊断提供了多种可靠的选择。确定了影响 HELLP 综合征诊断的关键因素,有助于医生更有针对性地关注相关指标,提高诊断的准确性和及时性。
不过,研究也存在一定局限性,如 HELLP 综合征样本数量有限,数据获取受到疫情影响等。未来,还需开展更大规模的研究,进一步验证研究结果的有效性和普遍性;深入研究 HELLP 综合征与子痫前期、子痫等其他妊娠相关疾病的鉴别诊断;运用聚类机器学习方法和可解释的 DL 模型,挖掘更多潜在信息,为改善孕妇护理质量、保障母婴健康提供更坚实的理论和技术支持。相信随着研究的不断深入,我们对 HELLP 综合征的认识和应对能力将不断提升,为广大孕妇的健康保驾护航。

涓嬭浇瀹夋嵎浼︾數瀛愪功銆婇€氳繃缁嗚優浠h阿鎻ず鏂扮殑鑽墿闈剁偣銆嬫帰绱㈠浣曢€氳繃浠h阿鍒嗘瀽淇冭繘鎮ㄧ殑鑽墿鍙戠幇鐮旂┒

10x Genomics鏂板搧Visium HD 寮€鍚崟缁嗚優鍒嗚鲸鐜囩殑鍏ㄨ浆褰曠粍绌洪棿鍒嗘瀽锛�

娆㈣繋涓嬭浇Twist銆婁笉鏂彉鍖栫殑CRISPR绛涢€夋牸灞€銆嬬數瀛愪功

鍗曠粏鑳炴祴搴忓叆闂ㄥぇ璁插爞 - 娣卞叆浜嗚В浠庣涓€涓崟缁嗚優瀹為獙璁捐鍒版暟鎹川鎺т笌鍙鍖栬В鏋�

涓嬭浇銆婄粏鑳炲唴铔嬬櫧璐ㄤ簰浣滃垎鏋愭柟娉曠數瀛愪功銆�

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号