基于可解释深度学习的急性淋巴细胞白血病(ALL)诊断:效率与透明度的协同

【字体: 时间:2025年04月15日 来源:Scientific Reports 3.8

编辑推荐:

  为解决急性淋巴细胞白血病(ALL)诊断中传统方法的局限、深度学习(DL)模型计算效率低及缺乏可解释性的问题,研究人员开展了 ALL 诊断框架的研究。结果显示,该框架诊断性能佳、计算效率高且具有可解释性,为 ALL 诊断提供了新工具。

  急性淋巴细胞白血病(Acute Lymphoblastic Leukemia,ALL)是一种严重威胁生命的血液恶性肿瘤,它就像隐藏在人体血液系统中的 “恶魔”,异常白细胞不受控制地疯狂增殖,肆意破坏正常的造血功能。在全球范围内,其发病率和死亡率不断攀升,世界卫生组织(WHO)预测到 2040 年,癌症的发病率和死亡率将近乎翻倍,ALL 作为其中的重要组成部分,无疑给全球健康带来了巨大挑战。
目前,传统的 ALL 诊断方法虽然在一定程度上发挥着作用,但存在诸多弊端。例如,一些方法具有侵入性,会给患者带来痛苦;检查过程耗时漫长,患者往往需要长时间等待结果,这对于病情危急的 ALL 患者来说,每一秒的等待都可能增加风险;而且,这些方法还容易受到多种因素影响,导致诊断不准确。即便医学影像和计算技术的出现提供了新的思路,可依靠放射科医生手动解读大量数据不仅工作量巨大、效率低下,还容易出现误诊,尤其是当细胞的细微变化成为诊断关键时,误诊的风险更高。

与此同时,基于深度学习(Deep Learning,DL)的诊断方法崭露头角,展现出巨大潜力。然而,它们也并非完美无缺。一方面,这些模型计算效率低下,处理数据的时间过长,在分秒必争的医疗场景中,这成为了阻碍其广泛应用的关键因素;另一方面,DL 模型犹如 “黑箱”,其决策过程难以理解,这让患者、医生和相关利益者对其缺乏信任,严重影响了它们在临床决策支持系统(Clinical Decision Support Systems,CDSS)中的应用。

为了攻克这些难题,来自爱尔兰戈尔韦大学(University of Galway)和巴基斯坦马拉坎德大学(University of Malakand)的研究人员展开了一项极具意义的研究。他们提出了一种全新的 ALL 诊断框架,将 EfficientNet-B7 架构与可解释人工智能(Explainable Artificial Intelligence,XAI)技术相结合,旨在提升诊断性能、计算效率和模型可解释性。该研究成果发表在《Scientific Reports》上,为 ALL 的诊断带来了新的曙光。

研究人员在研究过程中,主要运用了以下关键技术方法:利用 Python 编程语言,借助 TensorFlow 和 Keras 等深度学习库搭建模型;使用 AMD Ryzen 7 5700X 八核 CPU 和 16GB NVIDIA GeForce RTX 4080 GPU 的高性能计算设备进行模型训练和评估;采用 C-NMC-19、Taleqani Hospital 和 Multi Cancer 这三个包含不同 ALL 和正常细胞样本的数据集进行实验;运用数据预处理技术,如调整图像大小、归一化等,提升数据质量;通过集成 XAI 技术中的 Gradient-weighted Class Activation Mapping(Grad-CAM)、Class Activation Mapping(CAM)、Local Interpretable Model-Agnostic Explanations(LIME)和 Integrated Gradients(IG),实现对模型预测的可视化解释。

研究结果


  1. 模型性能卓越:研究人员将构建的模型与 VGG-19、InceptionResNetV2、ResNet50、DenseNet50 和 AlexNet 等基准模型进行对比,在多个数据集上进行评估。结果显示,在 Taleqani Hospital 数据集上,该模型准确率超 96%,C-NMC-19 和 Multi-Cancer 数据集上准确率分别达到 95.50% 以上。同时,其在 Area Under the Curve(AUC)、mean Average Precision(mAP)、Precision、Recall 和 F1-score 等指标上也表现出色,远超其他基准模型,充分证明了该模型强大的诊断能力。
  2. 计算效率大幅提升:在计算效率方面,新模型优势明显。在不同数据集上,它的推理时间比部分基准模型快 40%。例如在 Taleqani Hospital 数据集上,VGG-19 计算时间为 89.9 秒,而新模型仅需 59.28 秒,这使得新模型在临床实时诊断应用中更具可行性,极大地提高了诊断效率。
  3. XAI 技术增强可解释性:研究人员通过集成多种 XAI 技术,为模型预测提供了可视化解释。Grad-CAM 生成的热图能够精准地突出对模型预测贡献最大的图像区域;CAM 利用加权激活映射,直观地展示与模型预测相关的关键区域;LIME 通过扰动输入图像来确定影响模型预测的关键特征;IG 则量化每个输入特征对模型预测的贡献。经对比验证,Grad-CAM 表现最为出色,能最准确地反映模型决策依据,有效增强了医疗专业人员和患者对模型的信任。

研究结论与讨论


这项研究成功地将 EfficientNet-B7 与 XAI 方法相结合,在三个数据集上验证了该框架在 ALL 诊断中的有效性和可靠性。通过综合评估 AUC、mAP、Accuracy 等多个指标,证实了新框架在诊断性能和计算效率方面的优越性,为 AI 驱动的 ALL 诊断设立了新的标杆。

研究结果表明,该框架不仅在诊断 ALL 时能达到极高的准确率,还能大幅缩短计算时间,满足临床快速诊断的需求。同时,XAI 技术的融入增强了模型的可解释性,使医疗人员和患者更易理解模型的决策过程,有助于提高对 AI 诊断系统的信任度,推动 AI 技术在临床实践中的广泛应用。

然而,该研究也存在一些局限性。目前,框架的性能仅在血液学微观图像数据集上得到验证,其在其他医学成像领域和疾病诊断中的适用性有待进一步探索;多种 XAI 方法的集成虽提升了可解释性,但可能增加计算负担,需要在实时临床环境中优化;研究依赖标记数据集,在缺乏标注医疗数据的地区,框架的扩展性面临挑战;部分数据集规模较小,尽管采取了数据增强和正则化等策略,仍存在过拟合风险。

尽管存在不足,但这项研究为未来 AI 在医学诊断中的应用开辟了新方向。研究人员计划探索更多架构和 XAI 方法,将框架应用于更广泛的血液疾病诊断;利用半监督和无监督学习技术解决数据标注难题,提高框架的扩展性;优化 XAI 方法的计算负担,确保其在临床实时应用中的高效性。这些研究方向有望进一步提升 ALL 及其他疾病的诊断水平,为全球医疗健康事业带来更多福祉。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号