基于并行膨胀卷积和双重注意力机制的息肉图像分割

《Neural Networks》:Polyp Image Segmentation Based on Parallel Dilated Convolution and Dual Attention Mechanisms

【字体: 时间:2025年11月10日 来源:Neural Networks 6.3

编辑推荐:

  针对结直肠癌息肉图像分割中存在的多尺度特征提取不足和边界模糊问题,提出MSFNet模型,结合多尺度特征提取和通道注意力模块,在CVC-ClinicDB等数据集上实现优于U-Net等现有模型的分割精度,同时保持低参数量。

  在医学影像分析领域,结直肠癌的早期检测和诊断一直是一个备受关注的研究方向。结直肠癌通常由早期结肠息肉的恶性转化引发,而这些息肉本身是良性的。然而,若未能及时发现和处理,它们可能逐步发展为癌症。因此,早期息肉的识别对于提高患者的生存率具有重要意义。为了克服当前结肠癌医学影像诊断研究中存在的挑战,如小息肉定位困难以及由于息肉边缘不清晰导致的分割边界模糊问题,本文提出了一种新的息肉图像分割模型——MSFNet(多尺度特征U-Net),该模型通过多尺度上下文特征提取和重新聚合的通道注意力模块,实现了更精确的分割效果。

MSFNet的核心思想在于对图像的细节信息进行多尺度的提取和融合。在传统的医学影像分割模型中,尤其是基于卷积神经网络(CNN)的模型,往往因为使用单一尺度的卷积核而无法全面捕捉息肉的多尺度特征。此外,现有的模型在处理小息肉时,由于特征提取不够细致,导致定位不准确。为了应对这些挑战,MSFNet引入了多尺度特征提取机制,通过并行的大卷积核与扩张卷积操作,扩大了模型的感知范围,同时结合3×3的小卷积核以增强局部特征的提取能力。这种设计使得模型能够在不增加参数数量的情况下,有效获取图像中的关键信息,从而提升小息肉的检测和分割精度。

与此同时,MSFNet还采用了高效的通道注意力机制,用于整合通道信息与空间信息。在传统的U-Net模型中,跳跃连接(skip connection)通常直接将低层和高层的特征图进行融合,而没有充分考虑它们在语义上的关联性。这种做法可能导致特征融合不充分,从而影响分割的准确性。为了解决这一问题,MSFNet在跳跃连接的设计上进行了优化,通过多尺度的特征图融合机制,使得模型能够更有效地获取全局特征,同时抑制对无关特征的提取。这种设计不仅提高了模型的性能,还增强了其对复杂场景的适应能力。

在实际应用中,医学影像分割面临着诸多挑战,其中包括数据集的标注难度和图像本身的复杂性。由于医学影像的获取和标注过程需要专业人员的参与,这使得标注数据的获取成本较高,同时也限制了模型的训练和优化。因此,许多现有的分割模型在设计时都强调了对参数效率和模型复杂度的控制。然而,这些模型在处理小息肉和模糊边缘的分割任务时,仍然存在一定的局限性。例如,基于U-Net的模型虽然在结构上具有一定的优势,但由于其编码器仅使用3×3的卷积核,导致模型在多尺度特征提取方面表现不佳。此外,跳跃连接的设计也未能充分考虑特征图之间的语义一致性,从而影响了分割的准确性。

为了解决上述问题,本文提出了一种新的模型——MSFNet,该模型在结构上对U-Net进行了改进,引入了多尺度特征提取机制和重新聚合的通道注意力模块。通过并行的大卷积核与扩张卷积操作,MSFNet能够更有效地捕捉息肉的多尺度上下文信息,同时保持较低的参数数量。这一设计使得模型在处理小息肉和边缘模糊的分割任务时表现出更强的能力。此外,MSFNet还引入了多尺度的特征图融合机制,使得模型能够更全面地获取图像的全局信息,同时抑制对无关特征的提取,从而提升分割的准确性和稳定性。

在实验方面,本文使用了多个公开的结肠镜图像数据集进行验证,包括CVC-ClinicDB、Kvassir-SEG、CVC-ColonDB和ETIS-LaribPolypDB。这些数据集涵盖了不同规模和形状的息肉,为模型的训练和评估提供了丰富的样本。实验结果表明,MSFNet在这些数据集上的表现优于现有的先进医学影像分割模型,如U-Net、PraNet和SwinUNet。特别是在CVC-ClinicDB数据集上,MSFNet取得了Dice系数0.892和mIoU(平均交并比)0.926的优异结果,比U-Net的mIoU高出约10%。这表明,MSFNet在保持较低参数数量的同时,能够实现较高的分割精度和泛化能力。

此外,本文还对MSFNet的各个模块进行了详细的分析和设计。例如,在特征提取模块中,MSFNet采用了多尺度的特征提取方式,通过并行的大卷积核与扩张卷积操作,扩大了模型的感知范围,同时结合3×3的小卷积核以增强局部特征的提取能力。这种设计使得模型能够在不同尺度上捕捉息肉的关键特征,从而提升分割的准确性。在通道注意力模块中,MSFNet引入了高效的通道注意力机制,用于整合通道信息与空间信息。通过这种方式,模型能够更全面地理解图像的特征分布,从而提升分割的稳定性。

在跳跃连接的设计上,MSFNet采用了多尺度的特征图融合机制,使得模型能够更有效地获取全局特征,同时抑制对无关特征的提取。这种设计不仅提高了模型的性能,还增强了其对复杂场景的适应能力。通过这种方式,MSFNet能够在不增加参数数量的情况下,实现较高的分割精度和泛化能力。此外,本文还对MSFNet的各个模块进行了详细的分析和设计,确保其在实际应用中的有效性和稳定性。

为了进一步验证MSFNet的性能,本文在多个数据集上进行了实验。其中包括CVC-ClinicDB和Kvassir-SEG这两个较为常见的数据集,以及CVC-ColonDB和ETIS-LaribPolypDB这两个较少被使用的数据集。这些数据集涵盖了不同规模和形状的息肉,为模型的训练和评估提供了丰富的样本。实验结果表明,MSFNet在这些数据集上的表现优于现有的先进医学影像分割模型,如U-Net、PraNet和SwinUNet。特别是在CVC-ClinicDB数据集上,MSFNet取得了Dice系数0.892和mIoU 0.926的优异结果,比U-Net的mIoU高出约10%。这表明,MSFNet在保持较低参数数量的同时,能够实现较高的分割精度和泛化能力。

此外,本文还对MSFNet的各个模块进行了详细的分析和设计。例如,在特征提取模块中,MSFNet采用了多尺度的特征提取方式,通过并行的大卷积核与扩张卷积操作,扩大了模型的感知范围,同时结合3×3的小卷积核以增强局部特征的提取能力。这种设计使得模型能够在不同尺度上捕捉息肉的关键特征,从而提升分割的准确性。在通道注意力模块中,MSFNet引入了高效的通道注意力机制,用于整合通道信息与空间信息。通过这种方式,模型能够更全面地理解图像的特征分布,从而提升分割的稳定性。

在跳跃连接的设计上,MSFNet采用了多尺度的特征图融合机制,使得模型能够更有效地获取全局特征,同时抑制对无关特征的提取。这种设计不仅提高了模型的性能,还增强了其对复杂场景的适应能力。通过这种方式,MSFNet能够在不增加参数数量的情况下,实现较高的分割精度和泛化能力。此外,本文还对MSFNet的各个模块进行了详细的分析和设计,确保其在实际应用中的有效性和稳定性。

为了进一步验证MSFNet的性能,本文在多个数据集上进行了实验。其中包括CVC-ClinicDB和Kvassir-SEG这两个较为常见的数据集,以及CVC-ColonDB和ETIS-LaribPolypDB这两个较少被使用的数据集。这些数据集涵盖了不同规模和形状的息肉,为模型的训练和评估提供了丰富的样本。实验结果表明,MSFNet在这些数据集上的表现优于现有的先进医学影像分割模型,如U-Net、PraNet和SwinUNet。特别是在CVC-ClinicDB数据集上,MSFNet取得了Dice系数0.892和mIoU 0.926的优异结果,比U-Net的mIoU高出约10%。这表明,MSFNet在保持较低参数数量的同时,能够实现较高的分割精度和泛化能力。

此外,本文还对MSFNet的各个模块进行了详细的分析和设计。例如,在特征提取模块中,MSFNet采用了多尺度的特征提取方式,通过并行的大卷积核与扩张卷积操作,扩大了模型的感知范围,同时结合3×3的小卷积核以增强局部特征的提取能力。这种设计使得模型能够在不同尺度上捕捉息肉的关键特征,从而提升分割的准确性。在通道注意力模块中,MSFNet引入了高效的通道注意力机制,用于整合通道信息与空间信息。通过这种方式,模型能够更全面地理解图像的特征分布,从而提升分割的稳定性。

在跳跃连接的设计上,MSFNet采用了多尺度的特征图融合机制,使得模型能够更有效地获取全局特征,同时抑制对无关特征的提取。这种设计不仅提高了模型的性能,还增强了其对复杂场景的适应能力。通过这种方式,MSFNet能够在不增加参数数量的情况下,实现较高的分割精度和泛化能力。此外,本文还对MSFNet的各个模块进行了详细的分析和设计,确保其在实际应用中的有效性和稳定性。

综上所述,本文提出了一种新的医学影像分割模型——MSFNet,该模型在多尺度特征提取和重新聚合的通道注意力机制方面进行了创新设计。通过并行的大卷积核与扩张卷积操作,MSFNet能够更有效地捕捉息肉的多尺度上下文信息,同时保持较低的参数数量。这种设计使得模型在处理小息肉和边缘模糊的分割任务时表现出更强的能力。此外,MSFNet还引入了多尺度的特征图融合机制,使得模型能够更全面地获取图像的全局信息,同时抑制对无关特征的提取,从而提升分割的准确性和稳定性。实验结果表明,MSFNet在多个数据集上的表现优于现有的先进医学影像分割模型,如U-Net、PraNet和SwinUNet,证明了其在参数效率和分割精度方面的显著优势。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号