
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于状态空间模型的遥感图像定向目标检测新框架OriMamba
【字体: 大 中 小 】 时间:2025年08月06日 来源:International Journal of Applied Earth Observation and Geoinformation 8.6
编辑推荐:
针对遥感图像中目标多角度、多尺度和复杂背景带来的检测难题,广东技术师范大学计算机科学学院团队创新性地提出OriMamba框架。该研究通过混合Mamba金字塔网络(HMPN)融合多尺度特征,结合动态双头结构(DDH)提升角度预测精度,在DOTA-1.0等四大基准数据集上mAP提升0.5-2.88%,为遥感智能解译提供新思路。
在遥感监测领域,如何准确识别飞机、船舶等具有任意旋转角度的目标一直是重大挑战。传统水平边界框(HBB)检测方法会导致目标区域包含大量背景噪声,而现有基于Transformer的检测器又面临计算复杂度高的问题。随着无人机和卫星技术的普及,高分辨率遥感图像(RSIs)中目标的多角度分布、尺度差异和复杂背景干扰,使得定向目标检测(RSOD)成为学术界和工业界共同关注的焦点。
广东技术师范大学计算机科学学院的研究团队在《International Journal of Applied Earth Observation and Geoinformation》发表的研究中,提出了名为OriMamba的创新性解决方案。这项研究针对三个核心难题展开:首先,目标在航拍视角下呈现360°任意旋转特性;其次,同类目标可能同时存在数米到数百米的尺度差异;再者,云层遮挡、水面反光等复杂背景会严重干扰检测精度。研究团队通过巧妙融合状态空间模型(SSM)与深度学习技术,开发出兼具高效性和准确性的新型检测框架。
关键技术方法包括:1)设计混合Mamba金字塔网络(HMPN),整合自适应旋转空间金字塔池化(AR-SPP)模块提取旋转敏感特征;2)构建含局部分支的混合VSS模块,在保持线性计算复杂度的同时增强局部特征捕获能力;3)开发动态双头网络(DDH),通过可变形多头注意力(DMHA)瓶颈模块解耦分类与回归任务。实验采用DOTA-1.0等四个主流数据集,通过单尺度训练策略评估性能。
研究结果部分显示:
混合Mamba金字塔网络的有效性:通过AR-SPP模块生成的旋转敏感特征,使直升机(HC)检测mAP提升2.39%;而融合全局-局部信息的混合VSS块,在保持180.26G FLOPs低计算量下,比传统FPN提升1.01% mAP。
动态双头结构的优势:DDH网络通过4个DMHA瓶颈模块的级联,使尾类目标如棒球场(BD)的检测精度提升1.2%,验证了其对长尾分布的适应性。
综合性能突破:在DOTA-1.0测试集上达到78.23% mAP,较次优方法AO2-DETR提高0.5%;在更具挑战性的DOTA-1.5数据集上,以70.90% mAP领先现有方法2.88%。
这项研究的创新价值在于:首次将Mamba架构引入遥感目标检测领域,通过HMPN实现多尺度特征与旋转特征的协同优化,其线性计算复杂度克服了Transformer的二次方计算瓶颈。实际应用中,该技术可显著提升交通监控、智慧农业等场景下的自动化解译效率。未来研究可进一步探索VMamba主干网络的定制化设计,以充分发挥状态空间模型在遥感视觉任务中的潜力。
生物通微信公众号
知名企业招聘