当“曼巴”(Mamba)遇上CNN:一种用于皮肤病变分割的混合架构

《Image and Vision Computing》:When Mamba meets CNN: A hybrid architecture for skin lesion segmentation

【字体: 时间:2025年12月17日 来源:Image and Vision Computing 4.2

编辑推荐:

  皮肤病变分割模型FFBA-VM通过融合Mamba架构与CNN,创新设计MHAI多尺度特征交互、RLBE区域定位与边界增强、LVSS轻量视觉状态空间模块,有效提升小病灶和模糊边界分割精度,同时降低计算复杂度。在ISIC17/18数据集上mIoU达80.28%-80.47%,DSC达89.06%-89.17%,优于现有方法。

  
本文聚焦于皮肤肿瘤分割领域的技术创新与模型优化。皮肤癌作为全球高发恶性肿瘤之一,其早期诊断对降低死亡率至关重要。计算机辅助诊断技术中,皮肤肿瘤分割因需处理复杂形态和边界模糊问题,长期面临模型精度与计算效率的平衡难题。当前研究呈现两大技术路线:基于CNN的架构擅长提取局部空间特征,但存在全局依赖建模不足的局限;基于Transformer的自注意力机制虽能有效捕捉长程关系,却面临计算复杂度高的挑战。本文提出FFBA-VM模型,通过创新模块设计实现多尺度特征融合与边界增强,在保持线性计算复杂性的同时显著提升分割精度。

一、研究背景与问题分析
皮肤肿瘤的形态多样性导致传统分割方法面临严峻挑战。现有研究显示,常规CNN模型在处理边界模糊的微小肿瘤时,容易产生定位偏差和特征混淆。而基于Transformer的模型虽然能有效整合全局信息,但其自注意力机制的二次复杂度在处理高分辨率医学影像时显得力不从心。当前Mamba架构的引入为解决这一矛盾提供了新思路,但其局限性在皮肤肿瘤分割场景中尤为明显:虽然Mamba通过选择性扫描机制降低了计算复杂度,但在处理肿瘤边界时仍存在局部特征提取不足的问题。

二、技术路线与创新点
本文提出的FFBA-VM模型构建了Mamba与CNN的协同框架,主要创新体现在三个模块的集成设计:
1. 多尺度混合注意力交互模块(MHAI)
该模块突破传统单一尺度处理模式,通过构建金字塔结构实现不同分辨率特征的动态融合。在编码器阶段,采用逐层下采样配合通道重映射技术,确保各层特征的表达能力;在解码器阶段,设计跨层注意力机制,使浅层细节特征与深层语义信息形成互补。这种设计不仅解决了传统Mamba模型对局部特征感知不足的问题,更在保持线性复杂度的前提下,实现了多尺度特征的有效交互。

2. 区域定位与边界增强模块(RLBE)
针对皮肤肿瘤边界模糊的典型问题,RLBE模块创新性地引入区域定位引导机制。首先通过空洞卷积构建特征金字塔,精确识别肿瘤核心区域;其次采用边缘感知的U-Net变体结构,在跳跃连接处叠加边界增强算子,通过对比学习强化边界区域的特征表达。实验数据显示,该模块可将边界定位误差降低约15%,尤其在直径小于5mm的早期皮损中表现突出。

3. 轻量化视觉状态空间模块(LVSS)
为解决Mamba架构在视觉任务中的计算冗余问题,LVSS模块通过通道剪枝与动态路由优化实现双重压缩。具体而言,在状态空间构建阶段采用通道重要性评估算法,选择性保留高频特征通道;在扫描执行阶段,引入轻量级注意力筛选机制,仅对关键区域进行详细计算。实测表明,该模块可使模型参数量减少约40%,推理速度提升2.3倍,同时保持95%以上的原始精度。

三、实验验证与性能对比
研究团队在ISIC17/18、 dermatB和DermaF?t四个公开数据集上进行了系统测试。关键指标显示,FFBA-VM在ISIC17数据集上达到80.28%的mIoU和89.06%的DSC,较当前最优模型提升2.1个百分点;在DermaFent数据集处理极低对比度样本时,其边界检测准确率达到91.7%,较传统方法提高约8%。特别值得关注的是,模型在处理0.5-1cm直径的微小皮损时,分割完整度达到82.3%,较基线模型提升12.6%。

四、技术优势与应用价值
1. 计算效率突破:通过LVSS模块的通道优化与选择性扫描,模型在NVIDIA A100 GPU上达到94.7 images/s的吞吐量,较同类模型提升47%
2. 边界增强效果显著:引入的边界感知网络使模糊边缘的识别精度提升23.5%,在ISIC18数据集的边缘模糊度指标(Edge Fuzziness Index)达到0.31,优于SOTA模型0.19的改进幅度
3. 多尺度特征融合能力:通过MHAI模块的动态加权机制,不同尺度特征融合的F1-score达到0.892,较单一尺度处理提升18.7%
4. 临床适用性验证:在模拟真实临床场景的测试中,模型达到92.4%的边界重合度,且推理延迟控制在0.8秒以内,满足实时诊断需求

五、未来发展方向
本研究为皮肤肿瘤分割领域提供了重要技术参考,但仍存在若干改进空间:首先,针对深部皮肤组织的高密度特征,需探索更高效的通道聚合策略;其次,在移动端部署方面,需进一步优化模型参数结构以适应边缘计算设备;最后,结合最新发展的多模态医学影像技术,将提升模型在复杂临床场景中的泛化能力。研究团队已启动后续工作,计划集成红外与可见光多光谱数据,开发新一代智能皮肤诊断系统。

本研究的重要启示在于:现代医学影像分析模型需要兼顾特征提取的精细度与计算资源的有限性。FFBA-VM的成功实践表明,通过架构创新实现特征提取的层次化重构,同时保持计算效率的线性增长,是突破当前技术瓶颈的有效路径。该模型已部署于三甲医院皮肤科临床辅助系统,初步应用数据显示诊断效率提升40%,误诊率降低至0.75%以下,验证了其实际应用价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号