基于课程学习的乳腺癌筛查中高效可解释深度学习模型的研究进展

《Insights into Imaging》:Annotation-efficient, patch-based, explainable deep learning using curriculum method for breast cancer detection in screening mammography

【字体: 时间:2025年03月20日 来源:Insights into Imaging 4.1

编辑推荐:

  本研究针对乳腺癌筛查中深度学习模型对大量标注数据的需求问题,开展基于课程学习的高效可解释深度学习模型研究,结果显示该模型仅需20%的强标注数据即可超越仅使用图像级标注的基线模型,且在外部数据集上表现出良好的泛化能力,为大规模乳腺癌筛查提供了新的解决方案

  随着乳腺癌筛查需求的增加,如何高效利用深度学习技术进行乳腺癌检测成为研究热点。本研究聚焦于开发一种高效的深度学习模型,该模型通过课程学习方法和基于补丁(patch-based)的策略,结合弱(图像级)和强(边界框)标注,实现了在乳腺X线摄影中对乳腺癌的检测,并提供了可解释的人工智能(XAI)支持。研究结果表明,即使在仅有20%强标注数据的情况下,该模型的性能也优于仅使用图像级标注的基线模型,并且在外部数据集上展现出良好的泛化能力。这一成果为在大规模乳腺癌筛查中部署深度学习模型提供了新的思路和方法。

研究背景与意义

乳腺癌是全球女性最常见的恶性肿瘤之一,早期检测对于提高治愈率和改善患者预后至关重要。乳腺X线摄影(Mammography)作为一种成熟的筛查手段,因其便捷性、成本效益和较高的准确性而被广泛应用。然而,随着筛查需求的增加,放射科医师面临着解读大量乳腺X线图像的挑战,这不仅可能导致报告延迟和筛查遗漏,还可能增加诊断错误的风险。近年来,深度学习(Deep Learning, DL)技术的快速发展为解决这一问题提供了新的思路。DL模型能够通过学习大量图像数据中的特征,辅助或替代放射科医师进行疾病诊断。然而,DL模型通常需要大量的标注数据来进行训练,尤其是在计算机视觉领域,强监督训练(如像素级或边界框标注)能够显著提升模型性能,但获取这些标注数据需要耗费大量专家资源。此外,DL模型的“黑箱”特性也限制了其在临床中的应用。因此,开发一种数据高效、可解释的DL模型对于乳腺癌筛查具有重要的现实意义。

研究方法

本研究由国内某研究机构的研究人员开展,旨在开发一种基于课程学习(Curriculum Learning)的深度学习模型,用于乳腺癌筛查中的乳腺X线摄影图像分析。研究团队首先收集了来自三家附属私立大学医院的1976张乳腺X线摄影图像,其中包括癌症阳性和阴性样本。为了训练模型,研究团队采用了课程学习方法,将图像分割成不同大小的补丁(patches),并逐步增加补丁大小进行训练。模型训练分为四个阶段,初始阶段使用128×128像素的补丁,随后逐渐增加到256×256像素和512×512像素,最终在完整图像上进行训练。这种方法使模型能够从局部细节到整体图像逐步学习乳腺癌的特征。此外,研究团队还引入了可解释人工智能(Explainable Artificial Intelligence, XAI)技术,通过梯度加权类激活映射(Gradient-weighted Class Activation Mapping, Grad-CAM)方法,生成热力图(heatmaps)来解释模型的决策过程,并通过与放射科医师标注的边界框的重叠率来评估模型的可解释性。

研究结果

研究结果显示,使用课程学习方法训练的深度学习模型在不同强监督水平下均表现出优于基线模型的性能。具体而言,仅使用20%强标注数据的课程学习模型(Curriculum 20)的F1分数为82.41±0.47,而基线模型的F1分数为80.55±0.88。随着强标注数据比例的增加,模型性能进一步提升,使用100%强标注数据的课程学习模型(Curriculum 100)的F1分数达到83.95±0.55。在外部数据集测试中,该模型也展现出良好的泛化能力,Curriculum 100模型的F1分数为78.73±1.25,而基线模型的F1分数为74.65±1.35。此外,课程学习模型的可解释性也得到了显著提升,Curriculum 100模型的地面真实重叠率(Ground Truth Overlap Ratio)为64.18±1.37,显著高于基线模型的60.26±1.91。这表明该模型不仅能够更准确地检测乳腺癌,还能更好地解释其决策过程,为临床应用提供了重要的支持。

研究结论与讨论

本研究通过课程学习方法和基于补丁的策略,成功开发了一种高效的深度学习模型,用于乳腺癌筛查中的乳腺X线摄影图像分析。该模型在有限的强标注数据下表现出色,且具有良好的可解释性和泛化能力。这一成果不仅为乳腺癌筛查提供了一种新的技术手段,也为深度学习在医学图像分析中的应用提供了新的思路。未来的研究可以进一步探索该模型在不同乳腺X线摄影视图(如头尾位CC和内外斜位MLO)上的表现,以优化模型性能并提高其临床适用性。此外,随着深度学习技术的不断发展,如视觉变换器(Vision Transformers)和基于注意力机制的方法,未来的研究可以进一步探索这些新兴技术在乳腺癌筛查中的应用潜力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号