基于变分模态分解(VMD)的航空影像语义分割人工智能方法研究

【字体: 时间:2025年05月26日 来源:Engineering Applications of Artificial Intelligence 7.5

编辑推荐:

  针对航空影像样本少、小目标及多目标分割难题,研究人员创新性引入信号处理领域的变分模态分解(VMD)技术,耦合UNet、SegNet等深度学习模型,在Dubai等数据集上实现mIoU 80.27%的突破性性能提升,为高分辨率遥感图像分析提供新范式。

  

论文解读

在无人机航拍和卫星遥感技术爆发的时代,高空俯瞰视角下的城市建筑、船舶、植被等目标的精准分割,犹如让计算机具备"透视眼"能力。然而这种"上帝视角"却暗藏玄机——目标尺寸差异悬殊、密集排列导致的边界模糊、阴影干扰等问题,使得传统分割方法频频"失明"。更棘手的是,标注高分辨率航空影像需要人工逐像素勾画,成本之高让研究者们不得不面对"数据饥荒"的困境。

针对这些挑战,研究人员开展了一项跨界融合研究。他们从信号处理领域"借"来变分模态分解(VMD)这一数学工具,将其与深度学习模型创新结合。VMD如同给图像做"频谱CT",能将原始影像分解为不同频率成分的模态,其中高频模态捕捉边缘细节,低频模态保留主体结构。研究团队特别设计了基于Haralick纹理特征的模态筛选机制,并开创性地将VMD用于数据增强——通过对有限样本的模态重组,有效扩充训练集规模。

关键技术方法
研究采用UNet、SegNet、DeepLabv3和UNet-Vision Transformer(ViT)四种架构作为基础模型,在NWPU-VHR10、AID和Dubai三个公开数据集上验证。核心创新在于:1) 对RGB三通道独立实施二维VMD分解;2) 基于模态相关性分析构建重构图像;3) 引入ViT的注意力机制强化全局特征捕捉。

研究结果
Related works:系统梳理了阈值分割、SVM等传统方法与深度学习的优劣,指出小样本条件下模型泛化能力不足是瓶颈。
Deep learning models and pre-processing tool:验证VMD预处理可显著提升UNet在噪声环境下的鲁棒性,ViT的注意力机制能有效缓解目标遮挡问题。
Proposed methodology:开发的模态选择算法使计算效率提升40%,重构图像在mIoU指标上较原始输入提高12.6%。
Experimental setup:在Dubai数据集上,VMD-UNet-ViT组合对建筑物边缘分割精度达像素级,船舶分割F11分数突破0.89。
Results and discussions:跨数据集测试表明,该方法在样本量减少30%时仍保持83.4%的稳定性,显著优于传统数据增强手段。

结论与意义
这项发表于《Engineering Applications of Artificial Intelligence》的研究,开创了信号处理与计算机视觉的跨界融合范式。Anupa Vijai等研究者证明:1) VMD重构能有效提取航空影像的多尺度特征,使UNet的mIoU提升至80.27%;2) 模态重组策略可替代30%的真实样本需求;3) ViT的全局注意力与VMD的局部特征形成互补优势。该技术已应用于迪拜城市规划项目,为智慧城市建设中大规模地物自动普查提供了新工具,未来在灾害评估、生态监测等领域具有广阔前景。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号