基于 VMAXL-UNet 的医学图像分割:突破传统局限,开启精准医疗新篇

【字体: 时间:2025年03月11日 来源:Scientific Reports 3.8

编辑推荐:

  为解决传统医学图像分割方法的局限,研究人员提出 VMAXL-UNet 模型,实验证明其性能优越,意义重大。

  在医学领域,高分辨率医学图像就像医生的 “透视眼”,对疾病诊断和治疗意义非凡。然而,这些图像的复杂性和多样性却让传统的图像分割方法 “望而却步”。以视网膜血管分割为例,低对比度、高噪声和亮度变化等问题,使得分割精度总是不尽人意,而且大量的数据标注工作既耗时又费力。
卷积神经网络(CNNs)的出现,曾让医学图像分割领域看到了希望。它凭借强大的建模能力迅速走红,其中 UNet 专为生物医学图像分割设计,其对称的 “U” 形结构在处理医学图像复杂结构时表现出色,众多基于 UNet 的变体也不断涌现。但卷积操作的固有局限,让基于 CNNs 的网络在捕捉全局上下文和长距离依赖关系时显得力不从心,在复杂语义建模任务中难以发挥更大的作用。

Transformer 的引入为解决这些问题带来了新的思路。它在自然语言处理领域大放异彩,处理长距离依赖和复杂上下文关系的能力堪称一绝。Vision Transformer(ViT)将其应用到图像分类任务,随后一系列基于 Transformer 的医学图像分割模型也相继诞生。然而,这些模型在捕捉局部细节方面存在不足,计算复杂度还很高,尤其是在处理高分辨率图像时,这使得它们在临床应用中困难重重。虽然一些结合 CNNs 和 Transformer 的混合模型取得了一定进展,但在性能提升和计算成本降低之间仍未找到理想的平衡。

在此背景下,云南大学信息科学与工程学院的研究人员展开了深入研究。他们提出了 VMAXL-UNet,这是一种全新的医学图像分割网络,融合了结构化状态空间模型(SSM)和轻量级 LSTM(xLSTM)的优势,相关研究成果发表在《Scientific Reports》上。

研究人员在构建 VMAXL-UNet 时,运用了多种关键技术方法。模型整体采用编码器 - 解码器架构和跳跃连接(skip connections),编码器负责提取特征,解码器用于恢复图像分辨率以实现精准分割,跳跃连接则能保留更多细节信息。编码器和解码器中还包含 VSS(Visual State Space)块、ViL(Vision-LSTM)块和 BasicConv 块等多种模块。其中,VSS 块源于 VMamba,通过特殊的 2D 选择性扫描(SS2D)模块等结构,能有效捕捉长距离依赖关系并提取关键特征;ViL 模块利用 mLSTM(Matrix LSTM,源自 xLSTM)增强了对局部细节和边缘信息的建模能力;BasicConv 块则由卷积层、实例归一化层和 ReLU 激活函数组成,采用残差连接,有助于优化特征信息。

研究人员使用了多个医学图像数据集进行实验,包括 ISIC17、ISIC18、Kvasir-SEG 和 ClinicDB。在实验过程中,他们对图像进行预处理,调整大小并采用数据增强技术,使用 AdamW 优化器和 CosineAnnealingLR 学习率调度器,还设计了结合二元交叉熵和 Dice 相似系数的混合损失函数。

实验结果令人瞩目。在与多种先进模型的对比中,VMAXL-UNet 在所有数据集上都表现优异。在 ISIC17 和 ISIC18 数据集上,其平均交并比(mIoU)和 Dice 系数均高于其他模型;在 Kvasir-SEG 和 ClinicDB 数据集上优势更为显著,这两个数据集的目标边界模糊,VMAXL-UNet 却能有效捕捉长距离依赖关系,提升分割性能。从计算复杂度和参数数量来看,VMAXL-UNet 在保证精度的同时,效率也相当可观。通过可视化分析发现,VMAXL-UNet 在分割小物体时,不仅能精准定位目标区域,还能生成清晰连贯的边界,在局部特征提取和全局上下文建模方面都表现出色。

研究人员还进行了消融实验。改变编码器结构后发现,仅使用 BasicConv 块的模型虽比传统 U-Net 性能好,但加入 VSS 和 ViL 模块的 VMAXL-UNet 性能提升更为显著,充分证明了这两个模块的重要性。探索 VSS+ViL 模块块数量对模型性能的影响时发现,并非模块数量越多越好,数量为 1 时模型分割精度更高。

在注意力可视化对比分析中,VMAXL-UNet 的注意力热图能精确覆盖病变区域,与手动标注的真实区域高度一致,而其变体模型则存在注意力分散、难以聚焦病变边界等问题,进一步验证了 VMAXL-UNet 在捕捉病变细节和边界信息方面的优势。

综上所述,VMAXL-UNet 为医学图像分割带来了新的突破。它通过创新的模块设计,有效提升了模型性能,在多个医学图像数据集上表现卓越。不过,该模型在计算效率方面仍有提升空间。未来,研究人员可探索更轻量级的网络架构或改进训练策略,降低计算成本。同时,VMAXL-UNet 的通用性为其在 3D 医学图像分割、器官分割和肿瘤检测等更多图像处理任务中的应用提供了可能,有望进一步推动精准医疗的发展,为临床诊断和治疗提供更有力的支持。

娑撳娴囩€瑰宓庢导锔炬暩鐎涙劒鍔熼妴濠団偓姘崇箖缂佸棜鍎禒锝堥樋閹活厾銇氶弬鎵畱閼筋垳澧块棃鍓佸仯閵嗗甯扮槐銏狀洤娴f洟鈧俺绻冩禒锝堥樋閸掑棙鐎芥穱鍐箻閹劎娈戦懡顖滃⒖閸欐垹骞囬惍鏃傗敀

10x Genomics閺傛澘鎼isium HD 瀵偓閸氼垰宕熺紒鍡氬劒閸掑棜椴搁悳鍥╂畱閸忋劏娴嗚ぐ鏇犵矋缁屾椽妫块崚鍡樼€介敍锟�

濞嗐垼绻嬫稉瀣祰Twist閵嗗﹣绗夐弬顓炲綁閸栨牜娈慍RISPR缁涙盯鈧鐗哥仦鈧妴瀣暩鐎涙劒鍔�

閸楁洜绮忛懗鐐寸ゴ鎼村繐鍙嗛梻銊ャ亣鐠佹彃鐖� - 濞e崬鍙嗘禍鍡毿掓禒搴n儑娑撯偓娑擃亜宕熺紒鍡氬劒鐎圭偤鐛欑拋鎹愵吀閸掔増鏆熼幑顔垮窛閹貉傜瑢閸欘垵顫嬮崠鏍掗弸锟�

娑撳娴囬妴濠勭矎閼崇偛鍞撮摂瀣鐠愩劋绨版担婊冨瀻閺嬫劖鏌熷▔鏇犳暩鐎涙劒鍔熼妴锟�

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号