一种基于血细胞参数的恶性血液病筛查新方法

【字体: 时间:2025年02月12日 来源:BMC Medical Informatics and Decision Making 3.3

编辑推荐:

  本研究针对恶性血液病筛查难题,基于血细胞参数构建机器学习模型,发现人工神经网络(ANN)模型表现最优,为早期诊断提供新思路,具有重要意义

  恶性血液病(Malignant Hematological Diseases)是全球范围内的重大健康挑战,其发病率和死亡率均居高不下。根据国际癌症研究机构(IARC)2020年的调查,包括非霍奇金淋巴瘤、白血病、多发性骨髓瘤和霍奇金淋巴瘤在内的恶性血液病,当年新增患者超过100万,死亡人数超过60万。随着人口增长和老龄化加剧,预计到2040年,癌症发病率将增加47%,这将给社会和经济带来巨大负担。因此,早期预防、诊断和治疗这些癌症显得尤为重要。
目前,恶性血液病的临床诊断面临诸多挑战,其临床表现多样且隐匿,世界卫生组织(WHO)和国家综合癌症网络(NCCN)虽已制定一系列识别和分类检测方法,如外周血细胞计数和形态学确认、骨髓穿刺和活检、影像学检查、免疫表型分析、细胞遗传学检测、淋巴结活检和血清蛋白检测等,但这些检测手段复杂且成本较高。相比之下,外周血细胞计数分析和形态学检查是最容易实施且成本最低的方法。近年来,随着自动化血细胞分析技术的进步,如迈瑞BC-7500 CRP通过激光流式细胞术结合散射荧光立方(SF cube)技术,能够收集大量细胞信息,为研究提供了丰富的数据基础。
在此背景下,国内多家单位的研究人员开展了一项多中心研究,旨在通过构建基于血细胞参数的机器学习模型,为恶性血液病的筛查提供一种高效、低成本的新方法。研究涉及10家三级医院,共收集了1751名患者的静脉血样本,分为训练集(1223例)和验证集(528例)。研究人员从迈瑞BC-7500 CRP和MC-80自动化形态学分析仪获取了114个参数,并通过手动筛选和过滤,最终选取了26个与恶性血液病强相关的血细胞参数,构建了包括逻辑回归(LR)、朴素贝叶斯(NB)、K最近邻(KNN)、支持向量机(SVM)、随机森林(RF)、多层感知器(MLP)、梯度提升决策树(GBDT)和人工神经网络(ANN)在内的8种机器学习模型。
研究结果显示,在验证集样本中,ANN模型在识别恶性血液病方面表现最优,其接收者操作特征曲线下面积(AUC)为0.906,准确度为0.857,敏感性为0.832,特异性为0.884。此外,研究人员还对模型的校准效能和临床适用性进行了评估,发现经Platt校准后的ANN模型预测风险与实际比例的一致性显著提高。决策曲线分析(DCA)也表明,ANN、RF和GBDT模型的净临床效益优于其他模型。
进一步分析ANN模型的黑箱问题,研究人员通过SHAP分析发现,PLT-I(阻抗通道血小板计数)、原始细胞和PCT(血小板比容)是模型中最重要的特征。这些特征在预测恶性血液病风险中起关键作用。尽管ANN模型在筛选恶性血液病方面表现出色,但也存在一些局限性,例如在淋巴瘤患者中,由于其外周血细胞参数变化不明显,模型的识别能力受到一定限制。此外,模型在外部验证和临床应用中还需进一步优化。
综上所述,本研究基于血细胞参数构建的机器学习模型,尤其是ANN模型,在恶性血液病筛查中展现了良好的应用前景。该方法不仅成本低廉、高效便捷,还能为缺乏先进诊断设备的基层医院提供有力支持,有助于患者尽早获得诊断和治疗。研究成果发表在《BMC Medical Informatics and Decision Making》上,为恶性血液病的早期筛查和诊断提供了新的思路和方法,具有重要的临床意义和社会价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号