基于双分支感知与多尺度语义聚合的胃镜图像中胃部解剖结构识别

《Displays》:Gastric Anatomical Sites Recognition in Gastroscopic Images Based on Dual-branch Perception and Multi-scale Semantic Aggregation

【字体: 时间:2025年10月02日 来源:Displays 3.4

编辑推荐:

  胃解剖结构识别方法在胃镜图像中的应用基于双分支感知和多尺度语义聚合,通过CNN和Swin Transformer结合提升局部纹理与全局语义建模能力,MCSA和MGPA模块增强多尺度上下文感知,实验验证在专家标注数据集上达到97.17%识别准确率,适用于早胃癌筛查的自动诊断。

  在现代医学领域,胃癌的早期检测和精准识别具有重要的临床意义。作为全球发病率和死亡率均居前列的恶性肿瘤之一,胃癌的诊断效率和准确性直接影响患者的生存率和治疗效果。特别是在胃镜检查中,准确识别胃部关键解剖部位是实现早期胃癌系统筛查和区域化诊断的基础。然而,由于胃镜图像中存在区域间细微差异以及结构边界模糊等问题,现有的识别方法在临床应用中表现不佳。为此,研究人员提出了一种基于双分支感知和多尺度语义聚合的胃部解剖部位识别方法(GASR),旨在提高胃镜图像中五个典型胃部区域的识别精度,并增强模型在复杂临床场景中的鲁棒性。

胃镜检查是早期胃癌筛查的重要手段,它能够直接观察胃黏膜的结构和病理变化,为病变的检测提供直观的影像依据。然而,实际应用中胃镜图像常受到多种因素的影响,如光照不均、黏膜褶皱、视角变化以及分泌物遮挡等,这些因素导致图像质量高度变化,信息密度大,且病变特征往往难以察觉。这不仅增加了临床医生的工作负担,也对诊断的一致性和准确性提出了更高要求。研究表明,胃镜诊断存在显著的主观差异,不同医生之间对同一病变的判断可能存在较大分歧,这在一定程度上限制了胃镜在早期筛查中的应用效果。

为解决上述问题,GASR方法结合了卷积神经网络(CNN)的局部特征提取能力和Swin Transformer的全局语义建模优势。该方法的核心在于构建双分支结构感知模块(DBSP),通过局部和全局特征的互补性提升模型的识别能力。DBSP模块的设计使得模型能够同时捕捉胃镜图像中的细小结构变化和整体形态特征,从而增强对复杂区域的识别效果。此外,为了进一步优化多尺度上下文建模,研究人员引入了多尺度上下文采样聚合器(MCSA)模块,其灵感来源于空洞空间金字塔池化(ASPP)技术。MCSA模块通过改进的多尺度采样策略,有效提取了不同接收场域的特征信息,从而提升了模型对局部边界模糊区域的区分能力。

在全局语义建模方面,GASR方法还设计了多粒度池化聚合器(MGPA)模块,该模块基于金字塔场景解析(PSP)机制,利用自定义的多尺度池化核,增强了模型对全局结构布局的理解能力。MGPA模块不仅有助于捕捉层次化的空间语义,还能够提高模型对胃部整体形态特征的把握,从而提升识别的准确性。通过这些模块的协同作用,GASR方法能够在复杂的胃镜图像中实现对五个典型胃部区域的精准识别。

为了验证GASR方法的有效性,研究人员构建了一个由经验丰富的胃肠病专家标注的私有胃镜图像数据集,并通过五折交叉验证的方式对模型进行了全面评估。实验结果表明,GASR方法在该数据集上的识别准确率达到了97.17%,显示出强大的泛化能力和边界区分能力。这一结果不仅验证了方法在理论上的可行性,也为其在临床实践中的应用奠定了基础。GASR方法的高识别准确率意味着其能够在胃镜辅助诊断、EGGIM评分以及早期胃癌的自动化筛查中发挥重要作用。

从技术角度来看,GASR方法的创新点在于其双分支结构感知与多尺度语义聚合的结合。传统的胃部解剖部位识别方法往往局限于单一的特征提取方式,难以兼顾局部细节和全局语义。而GASR方法通过引入双分支结构,分别负责局部特征提取和全局语义建模,从而实现了对胃镜图像中不同尺度信息的全面捕捉。这种设计不仅提高了模型的识别能力,还增强了其对复杂图像的适应性。同时,MCSA和MGPA模块的引入,进一步优化了模型对多尺度上下文信息的处理能力,使得模型能够在不同视角和光照条件下保持较高的识别性能。

此外,GASR方法在数据集构建和模型训练方面也进行了深入探索。研究人员强调,高质量的标注数据是提升模型性能的关键因素之一。因此,他们特别关注了专家标注的准确性和一致性,确保数据集的可靠性。同时,考虑到胃镜图像标注成本较高,研究人员还探索了如何在有限标注数据的情况下,提高模型的泛化能力。通过五折交叉验证,他们不仅验证了模型在不同数据子集上的表现,还确保了模型在实际应用中的稳定性。

在临床应用方面,GASR方法具有广阔的前景。随着人工智能技术在医学影像领域的不断发展,自动化诊断工具正在成为提升医疗效率的重要手段。GASR方法的高识别准确率和良好的泛化能力,使其能够作为胃镜辅助诊断系统的重要组成部分,帮助医生更快速、更准确地识别胃部关键解剖部位,从而提高早期胃癌的筛查效率。同时,该方法还能够为EGGIM评分提供支持,通过精准识别胃部区域,辅助医生对胃癌前病变进行风险评估,进而制定更加科学的治疗方案。

在方法的实现过程中,研究人员还考虑了模型的可解释性问题。尽管深度学习模型在图像识别任务中表现出色,但其“黑箱”特性往往限制了其在临床环境中的应用。为此,GASR方法在设计时注重了模型的可解释性,通过多尺度语义聚合和双分支结构感知,使得模型能够更好地理解胃镜图像中的结构信息,从而提高其在临床决策中的可信度。此外,研究人员还提出了针对不同临床需求的定制化模块,如MCSA和MGPA,这些模块能够根据实际应用场景进行灵活调整,以满足不同医疗环境下的识别需求。

在研究的局限性方面,GASR方法仍面临一些挑战。首先,尽管该方法在专家标注的数据集上表现优异,但在实际临床应用中,图像质量的差异可能会影响模型的性能。因此,未来的研究需要进一步优化模型对低质量图像的适应能力。其次,由于胃镜图像的采集环境复杂,不同医院或设备之间的图像可能存在较大的差异,这需要模型具备更强的跨设备和跨机构泛化能力。此外,胃部解剖部位的识别涉及复杂的病理信息,模型需要在准确识别的基础上,进一步理解这些区域与疾病发展的关系,以提供更有价值的临床辅助。

综上所述,GASR方法为胃镜图像中的胃部解剖部位识别提供了一种新的解决方案。通过结合双分支结构感知和多尺度语义聚合,该方法在提高识别准确率的同时,也增强了模型在复杂临床场景中的鲁棒性。实验结果表明,GASR方法在专家标注的私有数据集上表现良好,显示出其在胃镜辅助诊断和早期胃癌筛查中的应用潜力。未来,随着更多高质量数据的积累和模型的进一步优化,GASR方法有望在临床实践中发挥更大的作用,为胃癌的早期检测和精准诊断提供有力支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号