编辑推荐:
为解决 U-Net 局限性,研究人员开展相关研究,新网络性能优于多种模型,意义重大。
卷积神经网络(CNNs)在计算机视觉领域,尤其是医学图像分割方面取得了显著成就。U-Net 作为一种杰出的架构,实现了重大突破,在实际应用中广泛使用。然而,其统一的下采样策略以及编码器中卷积层的简单堆叠,限制了它在多个深度捕获丰富特征的能力,降低了快速图像处理的效率。为了解决这些局限性,本文提出了一种新颖的分割网络,该网络将注意力机制与多层感知器(MLPs)相结合。该网络旨在逐步捕获并优化不同层次的特征。在低层级,引入主特征保留(PFC)模块,以保留关键的空间细节,减少下采样过程中主特征的损失。在中层级,紧凑注意力模块(CAB)通过多路径注意力结构增强特征交互,提升网络捕获多样化语义信息的能力。在高层级,集成了 Shift MLP 和 Tokenized MLP 模块。Shift MLP 模块沿着不同轴移动特征通道,通过聚焦卷积特征的特定区域来增强局部特征建模。Tokenized MLP 模块将这些特征转换为抽象令牌,并利用 MLP 在潜在空间中对其表示进行建模,有效减少了参数数量和计算复杂度,同时提高了分割性能。在结直肠癌肿瘤数据集 CCI 和公开数据集 ISIC-2018 上进行的实验表明,所提出的方法在性能上显著优于 U-Net、U-Net++、Swin-U-Net、Attention U-Net 和 RA-U-Net,平均提升分别为 6.67%、5.53%、10.18%、4.78% 和 3.55%。代码可通过以下链接获取:
https://github.com/QingTianer/SAMP-Net.git。