RHAM-CA-Det:面向复杂自然环境的蝴蝶检测注意力机制研究

《Chinese Journal of Electronics》:RHAM-CA-Det: An Attention Mechanism for Butterfly Detection

【字体: 时间:2025年11月12日 来源:Chinese Journal of Electronics 3

编辑推荐:

  针对自然环境中蝴蝶检测存在的纹理微差异和复杂背景干扰问题,本研究提出基于Faster R-CNN的RHAM-CA-Det模型。通过引入可学习集成通道注意力(CALI)模块和区域混合注意力(RHAM)模块,在公开蝴蝶数据集上实现68.1%的平均精度(mAP),较YOLOv8提升9.0%。该研究为生物多样性监测提供了更可靠的计算机视觉解决方案。

  
在生物多样性研究和生态监测领域,蝴蝶作为对环境变化极其敏感的生物指示物种,其种群动态能够有效反映生态系统健康状况。然而传统依赖人工实地观测的蝴蝶调查方法存在效率低下、成本高昂的局限性。随着计算机视觉技术的快速发展,基于深度学习的蝴蝶自动检测技术逐渐成为研究热点,但在实际应用过程中仍面临两大核心挑战:一是形态相似的蝴蝶物种间往往仅存在细微的纹理差异,要求模型具备捕捉微观特征的能力;二是野外拍摄的蝴蝶图像常包含复杂背景干扰,这些噪声信息会严重影响模型对前景目标的识别精度。
针对这些技术瓶颈,苏州大学计算机科学与技术学院的黄宇翔和杨哲研究员在《Chinese Journal of Electronics》上发表了一项创新性研究,提出名为RHAM-CA-Det的新型蝴蝶检测模型。该研究通过将注意力机制与卷积神经网络深度融合,显著提升了模型在复杂自然场景下的检测性能。特别值得关注的是,该模型在保持计算效率的同时(约440.99 GFlops),在公开蝴蝶数据集EIAB上实现了68.1%的平均精度(mAP),较主流模型YOLOv8提升9.0%,展现出强大的实际应用潜力。
研究方法方面,作者以Faster R-CNN为基础框架,采用ConvNeXt作为主干网络增强特征提取能力。创新性地设计了两个核心模块:可学习集成通道注意力(CALI)模块通过动态门控机制优化特征通道权重分配;区域混合注意力(RHAM)模块则创新性地将图像区域划分为重要区域和次要区域,分别采用自注意力机制和卷积操作进行处理。实验采用EIAB数据集(含22个物种的479张图像),按8:2比例划分训练测试集,使用PyTorch 2.1.2在NVIDIA V100 GPU上完成模型训练。
关键技术方法包括:基于ConvNeXt架构的特征提取网络、特征金字塔网络(FPN)多尺度特征融合、区域提议网络(RPN)生成检测框,以及新提出的CALI和RHAM注意力模块。CALI模块通过全局平均池化和最大池化的双重路径提取特征,引入可学习的动态融合机制;RHAM模块则采用掩码技术将特征图分区,对重要区域实施自注意力计算,对次要区域采用常规卷积,实现精度与效率的平衡。
研究结果部分,通过系统性的实验验证了模型的有效性:在与主流检测器的对比中,RHAM-CA-Det在mAP(0.5:0.95)、mAP50和mAP75三个指标上分别达到68.1%、94.5%和82.6%,全面优于对比模型。特别是在识别难度最高的三个物种(Calinaga buddha formosana、Lampides boeticus和Papilio bianor)上,模型仍保持31.6%-57.3%的检测精度,显著优于其他方法。模块对比实验显示,CALI和RHAM单独使用时分别取得67.4%和67.1%的mAP,均优于传统注意力机制。消融实验进一步证实,ConvNeXt主干网络、CALI和RHAM模块的协同作用带来4.4%的性能提升。通用性测试表明,将所提模块移植到YOLOv5和GFL等单阶段检测器后,也能带来0.6%-4.6%的性能增益。
可视化分析结果直观展示了模型的优势:在复杂背景场景中,基线模型(Faster R-CNN)的注意力热图呈现分散特征,而加入CALI模块后模型能更聚焦于蝴蝶主体区域;RHAM模块则展现出更强的细节捕捉能力,在小型蝴蝶检测任务中能生成更精确的边界框。对比实验显示,在存在多重干扰的自然场景下,RHAM-CA-Det能有效避免漏检和误检,其检测框与真实标注(ground truth)的重合度显著高于Cascade R-CNN、YOLOv8等对比模型。
本研究通过创新性地集成通道注意力和区域混合注意力机制,成功构建了适用于自然场景的蝴蝶检测系统。RHAM-CA-Det模型在保持计算效率的前提下,有效解决了蝴蝶检测中的纹理微差异和背景干扰两大核心难题。实验结果表明,该模型在复杂生态环境中具有更强的鲁棒性和准确性,为生物多样性自动监测提供了可靠的技术支持。未来研究可进一步探索模型在多物种协同检测、实时视频流处理等场景的应用潜力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号