编辑推荐:
在医学影像分析中,现有模型(如 CNNs、Transformers)分割小医学物体(如黄斑水肿关键生物标志物 HRDs)时因信息丢失效果不佳。研究人员开展 EFCNet 模型的研究,该模型集成 CSAA 和 MPS 模块。结果显示其在 S - HRD 和 S - Polyp 数据集上优于现有模型,对临床诊断意义重大。
在医学影像的世界里,微小的病变往往蕴含着重大疾病的关键线索。以眼底光学相干断层扫描(Optical Coherence Tomography,OCT)中观察到的高反射点(HyperReflective Dots,HRDs)为例,它可是眼科医生眼中的 “宝贝”,作为视网膜疾病(如年龄相关性黄斑变性(age - related macular degeneration,AMD)、糖尿病性黄斑水肿(diabetic macular edema,DME)以及视网膜分支静脉阻塞(branch retinal vein occlusion,BRVO)引起的黄斑水肿)的潜在生物标志物,HRDs 的存在、数量和空间分布,就像一把把钥匙,能帮助医生们解锁这些疾病的严重程度和进展情况。但要获取这些关键信息可不容易,手动标注 HRDs 既耗时又费力,就像是在大海里捞针,效率极低。
与此同时,虽然图像分割模型发展得如火如荼,像 U - Net、ResUNet、DenseUNet、ResUNet++、TransFuse、Swin - UNet,还有近期很火的 SAM 等纷纷涌现,可在分割 HRDs 这类小医学物体时,它们却纷纷 “折戟”。传统方法在特征集成上存在局限,仅仅把目光放在编码器 - 解码器阶段,导致解码器在处理信息时 “缺衣少食”,无法充分利用编码器的全部信息。而且很多模型在最后解码阶段只使用单一的分割头进行监督,要知道早期解码阶段处理的低分辨率特征对小物体定位至关重要,可在卷积和上采样过程中,这些关键信息却大量丢失。再加上小医学物体本身数据量少,信息丢失的问题就更加雪上加霜,比如 SAM 模型,在分割小医学物体时表现就差强人意。
为了攻克这些难题,复旦大学的研究人员勇挑重担,开展了一项极具创新性的研究,他们提出了 EFCNet 模型。这项研究成果发表在《Scientific Reports》上,引起了广泛关注。
研究人员为开展这项研究,主要用到了以下几个关键技术方法:
- 构建数据集:建立了 S - HRD 和 S - Polyp 两个数据集。S - HRD 数据集来自复旦大学附属眼耳鼻喉科医院,包含 313 例 DME 或 BRVO 诱导的黄斑水肿患者的视网膜 OCT 扫描;S - Polyp 数据集则是从公开的 CVC - ClinicDB 中精心挑选出的 229 张图像子集,用于研究小息肉的分割。
- 设计模型架构:EFCNet 模型集成了跨阶段轴向注意力模块(Cross - Stage Axial Attention,CSAA)和多精度监督模块(Multi - Precision Supervision,MPS)。CSAA 模块通过自适应处理编码器各阶段的特征,优化特征融合;MPS 模块则在解码器中充分利用低分辨率特征,提升分割精度。
- 设定评估指标:采用骰子相似系数(Dice Similarity Coefficient,DSC)和交并比(Intersection over Union,IoU)这两个指标来评估模型性能,与众多先进模型进行对比。
下面来看看具体的研究结果:
- 定量结果分析:在 S - HRD 和 S - Polyp 数据集上,EFCNet 模型在所有折叠中,DSC 和 IoU 均显著优于先前的先进模型。在 S - HRD 数据集上,DSC 平均提高了 4.88%,IoU 提高了 3.77%;在 S - Polyp 数据集上,DSC 提高了 3.49%,IoU 提高了 3.25%。而且数据集里的医学物体越小,EFCNet 相比之前模型的优势就越明显。同时,研究发现 U - Net 扩大架构(U - Net - Large)带来的提升微乎其微,这表明 EFCNet 的卓越性能得益于其创新设计,而非单纯增加模型规模。
- 可视化结果:通过可视化对比,EFCNet 展现出明显优势。它能精准检测出极小的医学物体,在分割小医学物体边界时也更加准确,还大大减少了将背景误判为医学物体的情况。这充分体现了 CSAA 和 MPS 模块的强大作用,CSAA 利用编码器低层次特征的局部信息优化分割细节,MPS 则借助解码器早期低分辨率特征的全局感知信息,提升了小医学物体的检测和分割能力。
- 消融研究:对 CSAA 和 MPS 模块进行消融研究。分别将这两个模块单独集成到 U - Net 骨干网络中,发现它们都能显著提高分割精度,同时使用两个模块效果更佳。对 CSAA 模块不同配置的研究表明,聚合所有编码器阶段特征的 “AA - All” 配置性能最优;对 MPS 模块不同监督级别(连接不同数量的分割头)的研究发现,监督级别越高,分割精度越高。
最后总结一下研究结论和讨论部分。EFCNet 模型成功解决了小医学物体分割中信息丢失的难题,通过 CSAA 和 MPS 模块的协同作用,充分利用模型各阶段的特征,大幅提升了分割性能。在多个数据集上的实验结果表明,EFCNet 优于现有先进模型,为医学影像分析提供了更强大的工具,在精准诊断和疾病监测等方面具有巨大的应用潜力。
不过,这项研究也存在一些局限性。一方面,EFCNet 模型对计算资源要求较高,这在资源受限的环境中应用会面临挑战;另一方面,该模型目前仅针对单一医学图像模态,尚未融合其他模态(如自然语言)信息。但这些局限性也为后续研究指明了方向,相信未来在研究人员的努力下,医学图像分割技术会取得更大的突破,为人类健康事业带来更多福祉。