DP-CIADet:一种用于航空光学遥感图像的细节感知与关键信息聚合的紧凑型检测网络

《Optics & Laser Technology》:DP-CIADet: Detail perception and critical information aggregation compact detection network for aerial optical remote sensing images

【字体: 时间:2025年10月28日 来源:Optics & Laser Technology 4.6

编辑推荐:

  复杂背景与多尺度物体检测是空中光学遥感图像处理的关键挑战。本文提出DP-CIADet网络,通过RFFED模块融合多种降采样策略增强细粒度特征提取,并设计MCIANeck结构实现上下文融合的多尺度特征聚合。实验表明,在NWPU VHR-10和VisDrone数据集上,模型分别达到86%和26.037%的AP50,参数量仅2.14M,较传统方法减少30%以上参数,同时有效抑制背景干扰和提升小目标检测精度。

  在近年来计算机视觉技术迅速发展的背景下,无人机(UAV)光学遥感图像中的目标检测技术受到了广泛关注。这类图像通常具有复杂的背景和显著的目标尺度差异,这对现有检测算法提出了严峻的挑战。传统方法在处理这些挑战时,往往存在参数量大、计算复杂度高、检测精度不足以及多尺度适应性有限等问题。为了解决这些缺陷,本文提出了一种名为DP-CIADet的紧凑型检测网络,旨在实现高精度检测与低计算复杂度之间的平衡,特别是在复杂背景和多尺度目标识别任务中表现出色。

### 研究背景与挑战

随着无人机技术的快速发展,其具备高自由度和高分辨率成像能力,使得获取地面目标信息成为可能。与卫星遥感相比,无人机图像不仅能够提供更清晰的细节,还能在多种复杂环境中灵活应用,例如城市区域、交通场景和自然地形。然而,这种高分辨率的图像同时也带来了挑战:背景干扰严重,目标尺度差异显著,且部分目标(如小物体)容易与背景元素混淆,导致误检或漏检。此外,目标的尺度变化使得传统方法在处理不同大小的目标时面临性能瓶颈。

在面对这些挑战时,现有的检测方法主要依赖于特征金字塔网络(FPN)等结构,通过上下文建模和多尺度特征融合来增强模型的鲁棒性。然而,这些方法在提升特征表示能力的同时,往往忽略了对小尺度目标和背景干扰的处理,尤其是在特征融合过程中,未能有效分离高度相似的目标特征,导致检测效果受限。与此同时,轻量化模型虽然能够降低计算复杂度,但其在细节特征提取和复杂背景下的表现往往不如深度模型,尤其是在面对小目标识别和背景干扰时。

因此,如何在保持高精度检测的同时,有效降低模型参数量和计算复杂度,成为无人机遥感图像目标检测领域亟待解决的核心问题。DP-CIADet正是针对这一问题提出的一种创新性解决方案,它通过引入新的模块设计和结构优化,成功提升了复杂背景和多尺度目标检测的性能。

### DP-CIADet的创新设计

DP-CIADet的结构主要包括三个部分:用于特征提取的主干网络、用于特征融合的颈部结构以及用于目标预测的头部模块。其中,主干网络采用了一种基于卷积神经网络(CNN)的五层特征金字塔结构,以提取多尺度的特征图。这些特征图随后被送入颈部结构,该结构专门针对无人机遥感图像的复杂背景和多尺度特性进行了优化。

#### 1. 有效细节提取与噪声抑制模块(RFFED)

RFFED模块是DP-CIADet中的关键组成部分,其设计目标是通过融合多种下采样方法,提取更精细的特征,并抑制背景噪声。该模块通过使用SiLU(Sigmoid Linear Unit)激活函数和批量归一化(Batch Normalization)技术,提高了特征提取的稳定性与鲁棒性。SiLU相比传统的ReLU函数,具有更平滑的激活曲线,有助于缓解训练过程中的梯度爆炸问题,同时保留了特征的细节信息。此外,RFFED还结合了最大池化(Max Pooling)和平均池化(Average Pooling)操作,以增强模型对复杂背景的适应能力。

在RFFED中,主分支通过卷积操作提取局部空间特征,而辅助分支则通过最大池化提取全局信息,从而形成更全面的特征表示。随后,通过1x1卷积操作进行特征压缩,以减少冗余信息并提升计算效率。该模块的设计使得模型能够在复杂背景中更准确地识别目标,并在多尺度目标检测任务中保持较高的精度。

#### 2. 多尺度关键信息聚合颈部结构(MCIANeck)

MCIANeck是DP-CIADet的另一重要组成部分,其设计目标是通过引入自上而下(Top-down)和自下而上(Bottom-up)的特征交互路径,实现更高效的多尺度特征融合。传统FPN结构主要依赖于自上而下的特征传递,但其信息路径较长,容易导致特征模糊或丢失。此外,FPN在融合多尺度特征时,往往忽略了低级特征中的重要细节信息。

为了解决这些问题,MCIANeck引入了自下而上的路径,以增强模型对低级特征的利用能力。同时,该结构结合了CFSEM(Channel Feature Selection Extraction Module)模块,用于提取关键特征并动态分配权重。CFSEM模块通过结合最大池化和平均池化操作,增强了模型对特征的筛选能力,同时利用Sigmoid函数对特征进行加权,以确保模型能够更准确地捕捉目标信息并抑制背景干扰。

MCIANeck的引入,使得DP-CIADet在处理多尺度目标时,能够更有效地融合高阶语义信息与低阶定位信息。这种双向的特征交互路径不仅提高了模型的表达能力,还增强了其对复杂场景的适应性。通过这种方式,DP-CIADet能够更全面地提取目标特征,并在不同尺度的目标检测任务中保持较高的准确性。

#### 3. 紧凑模型设计与参数优化

在模型设计方面,DP-CIADet采用了轻量化策略,以减少参数量和计算复杂度。模型的总参数量仅为2.14 M,显著低于许多传统检测模型。这一设计使得DP-CIADet在资源受限的设备上具有更强的适用性,例如无人机设备或边缘计算平台。

为了实现这一目标,DP-CIADet在结构设计上进行了优化。例如,在特征融合过程中,通过特征压缩和信息路径的简化,有效减少了冗余计算。此外,模型在保持高精度的同时,还注重参数的合理配置,使得模型在实际部署中具备更高的效率和更低的资源消耗。

### 实验与结果分析

为了验证DP-CIADet的有效性,本文在两个公开数据集NWPU VHR-10和VisDrone上进行了实验。这两个数据集分别包含了不同场景下的遥感图像,涵盖了从城市街道到自然环境的广泛范围,具有丰富的背景干扰和目标尺度差异。

在NWPU VHR-10数据集上,DP-CIADet在精度(Precision)和平均精度(mAP50)方面均优于其他先进检测模型。例如,DP-CIADet在精度指标上达到了92.6%,显著高于YOLOv5n(85.6%)和YOLOv11n(84.5%)。此外,其在mAP50指标上也达到了86%,比YOLOv8n(81.8%)和YOLOv11n(84.5%)高出近5个百分点。

在VisDrone数据集上,DP-CIADet同样表现出色。在精度指标上,其达到了37.661%,优于YOLOv5n(25.6%)和YOLOv8n(37.621%)。同时,在mAP50指标上,DP-CIADet达到了26.037%,比其他方法高出一定水平。尽管在某些指标上略低于YOLOv11n,但其在参数量和计算复杂度方面的优势使其在实际应用中更具竞争力。

此外,为了进一步验证模型的泛化能力,本文还在RSOD(Remote Sensing Object Detection)数据集上进行了实验。该数据集包含多种类型的目标,并具有复杂的背景和多角度拍摄的特点。在RSOD数据集上,DP-CIADet在精度和召回率(Recall)指标上均优于YOLOv8n和YOLOv11n,分别达到了93.8%和90.2%。这表明,DP-CIADet不仅在特定数据集上表现出色,还具有良好的跨数据集适应性。

### 可视化分析与模块有效性验证

为了更直观地展示DP-CIADet在复杂场景中的表现,本文对检测结果进行了可视化分析。通过调整置信度阈值,模型能够更清晰地展示其对小目标和遮挡场景的识别能力。例如,在NWPU VHR-10数据集上,DP-CIADet能够准确识别被水包围的桥梁和森林背景中的网球场地等目标,同时在交通场景中也能有效区分车辆与背景中的道路或树木。

此外,本文还通过热图(Heatmap)分析展示了模型对目标的注意力分布。与YOLOv8n和YOLOv11n相比,DP-CIADet的热图显示出更清晰的目标特征响应,表明其在特征提取和目标识别方面具有更强的能力。这种设计使得模型在面对复杂背景和多尺度目标时,能够更有效地分离目标与背景,减少误检和漏检的发生。

### 模块分析与改进方向

为了进一步验证各个模块的有效性,本文进行了消融实验(Ablation Study)。实验结果表明,RFFED模块在提升检测精度方面起到了重要作用。例如,在NWPU VHR-10数据集上,引入RFFED后,模型的精度从91.3%提升至92.6%,且参数量减少了约28.9%。这表明,RFFED模块不仅提升了特征提取的精度,还有效降低了模型的计算复杂度。

MCIANeck模块在多尺度特征融合方面也表现出色。在NWPU VHR-10数据集上,引入MCIANeck后,模型的精度提升了1.2%,且参数量减少了30.7%。这说明,MCIANeck在提升模型性能的同时,也降低了计算负担,使其更适用于资源受限的场景。

### 总结与展望

本文提出的DP-CIADet在无人机光学遥感图像目标检测任务中展现出显著的优势。它不仅解决了传统方法在复杂背景和多尺度目标识别中的不足,还在保持高精度的同时,实现了轻量化设计。实验结果表明,DP-CIADet在两个公开数据集上的检测性能均优于其他先进方法,且在RSOD数据集上的泛化能力也得到了验证。

未来,研究团队计划进一步优化DP-CIADet的结构,以提高其在更多应用场景中的适应性。此外,他们还希望探索更高效的计算策略,以降低模型的资源消耗,并提升其在实际部署中的稳定性。通过不断改进,DP-CIADet有望成为无人机遥感图像目标检测领域的重要工具,为实际应用提供更可靠的技术支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号