联邦半监督学习突破乳腺MRI分割瓶颈:多中心验证显示DSC提升至94.8%

《Scientific Reports》:Enhancing breast magnetic resonance imaging segmentation with a federated semi-supervised approach

【字体: 时间:2025年12月05日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对乳腺磁共振成像(MRI)分割中标注数据稀缺与多中心数据隐私保护的矛盾,提出了一种联邦半监督学习框架。通过结合联邦学习(FL)的隐私保护优势与半监督学习(SSL)对未标注数据的利用能力,创新性地引入图像级强-弱扰动和特征级Dropout机制,在三个医院数据集上实现Dice相似系数(DSC)94.8%的优异性能,较基线模型提升最高达8.8%。该研究为医疗机构在数据受限环境下开展协同学习提供了可行方案。

  
在乳腺癌精准诊疗的征程中,磁共振成像(MRI)凭借其卓越的软组织分辨能力,已成为高风险人群筛查和疑难病例诊断的重要工具。然而,乳腺MRI图像的解读犹如在浩瀚星海中寻找特定星座,不仅耗时费力,更深受不同医师经验差异的影响。传统的人工分割方式既无法满足临床高效需求,也难以保证结果的一致性,这为人工智能辅助诊断技术提供了广阔的应用空间。
深度学习技术特别是卷积神经网络(CNN)在医学图像分割领域展现出强大潜力,U-Net、Attention U-Net等架构在各类医学影像任务中不断刷新性能纪录。但这些模型的卓越表现建立在海量高质量标注数据基础上,而医学数据的标注需要资深放射科医生投入大量时间精力,这对单个医疗机构尤其是资源有限的小型机构构成了巨大挑战。
更棘手的是,医疗数据因隐私保护要求无法在不同机构间自由流通。虽然联邦学习(FL)技术允许机构在不共享原始数据的前提下协同训练模型,但当每个机构仅拥有少量标注样本(如3-5个)时,传统联邦学习也难以发挥理想效果。与此同时,半监督学习(SSL)虽能利用大量未标注数据,但单一机构的模型泛化能力有限。如何在不侵犯数据隐私的前提下,最大化利用各机构的标注和未标注数据,成为亟待突破的技术瓶颈。
针对这一挑战,浙江人民医院等单位的研究团队在《Scientific Reports》上发表了一项创新研究,提出了一种联邦半监督学习框架,成功实现了乳腺MRI图像的高精度分割。该研究通过巧妙结合联邦学习和半监督学习的优势,在保护数据隐私的同时显著提升了模型性能,为多中心医疗AI协作提供了新范式。
关键技术方法包括:基于FedAvg的联邦学习框架整合三家医院数据;改进的半监督学习策略采用图像级弱扰动(
、翻转、旋转等)和强扰动(高斯模糊、CutMix等)以及特征级Dropout扰动;使用VGG16骨干的U-Net分割网络;基于置信度阈值(τ=0.95)的伪标签生成和四分量损失函数优化。
材料与方法
研究获得浙江人民医院伦理委员会批准,回顾性分析三家医院(C1小型、C2大型、C3中型)的乳腺MRI数据,包括9351-71820张切片。设基本标注场景(C1-C3标注比例1%/10%/5%)和苛刻场景(0.5%/5%/1%),并采用MAMA-MIA公共数据集进行外部验证。网络架构基于VGG16的U-Net,通过多扰动策略增强模型鲁棒性:对未标注样本施加弱扰动(
、翻转、旋转、马赛克、颜色增强)和强扰动(高斯模糊、CutMix),对弱扰动特征施加50%通道Dropout。损失函数融合监督损失(交叉熵+Dice损失)和无监督损失(基于伪标签的Dice损失),权重设置为λ1=0.5, λ2=0.125, λ3=0.125, λ4=0.25。
实验结果
主要研究问题(RQ1)显示,在苛刻标注场景下,该方法在全局测试集G上达到89.34% DSC和67.05% IoU,显著优于本地学习(LL)、联邦平均(FedAvg)、联邦自训练(FedST)和联邦梯度多样性减少(FedRGD)等基线模型。特别是在数据最稀缺的C1客户端,DSC提升达8.8%。外部验证中,在ISPY2、NACT等数据集上DSC达到78.64-84.29%,证明其强泛化能力。
收敛性能(RQ2)分析表明,该方法在苛刻场景下保持稳定收敛,而FedAvg等基线在100轮后早熟。消融研究(RQ3)验证了FL和SSL组件的协同作用:单独FL会因客户端数据异构产生负迁移,而FL+SSL组合有效缓解此问题,特别是对数据稀缺客户端C1提升显著。不同设置(RQ4)测试显示,τ=0.9时性能最优,而τ=0.65因增加真阳性捕获而意外提升召回率。
结论与意义
该研究提出的联邦半监督学习框架成功解决了医疗AI领域的数据稀缺与隐私保护两难问题。通过创新性的多级扰动策略和有效的联邦聚合机制,在多个真实临床数据集上实现了优于现有方法的分割性能。该方法使资源有限的小型医疗机构也能受益于多中心协作,推动医疗AI的普惠化发展。未来工作可探索更先进的客户端选择策略和个性化联邦学习方案,进一步提升在高度异构医疗环境中的适用性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号