
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于边界定位与背景抑制的复杂场景伪装目标检测模型MENet研究
【字体: 大 中 小 】 时间:2025年08月27日 来源:Engineering Applications of Artificial Intelligence 8
编辑推荐:
这篇研究提出了一种创新的三阶段解耦网络MENet,通过"定位-交互-融合"架构(含CAEM边缘模块、BGM边界引导模块)显著提升复杂背景下伪装目标(COD)的检测精度。模型采用PVT-V2主干网络提取多级特征,结合KFFM特征融合机制,在三个基准数据集上超越现有SOTA方法,为农业害虫监测等应用提供AI解决方案。
Highlight
当感知伪装目标时,人类视觉通常经历三阶段处理流程:首先基于全局上下文粗略定位兴趣区域(定位阶段),随后在该区域内动态切换目标与相似背景的注意力(交互阶段),此时边缘线索自然成为区分前景与背景的关键。最终整合边界、语义和上下文等多重感知信号(融合阶段)形成完整认知。
Camouflaged object detection
与显著目标检测(SOD)任务不同,伪装目标检测(COD)专注于检测视觉上不显著的对象,主要因为它们通常体积小、被遮挡、隐藏或具有自我伪装特性。由于这些物体的特殊属性,COD与SOD的检测目标差异显著。伪装目标因与周围环境差异极其细微而特别难以检测,使得COD任务复杂度更高。
Motivation
本研究受人类视觉认知机制启发,提出通过模拟"定位-交互-融合"的三阶段处理流程来突破现有COD技术瓶颈。特别关注边界语义的精确提取与背景干扰的主动抑制这两个关键科学问题。
Implementation details
模型在NVIDIA GeForce RTX 3090 GPU上基于PyTorch框架实现。训练阶段所有输入图像统一缩放至520×520分辨率,批量大小为8,初始学习率设为0.0001,采用AdamW优化器。共训练30个epoch,通过poly策略动态调整学习率(衰减指数0.9)。测试阶段保持相同输入尺寸以确保结果可比性。
Application
害虫是导致作物减产和疾病传播的主要因素。传统视觉方法在识别伪装害虫方面存在困难,本研究提出的COD框架为智慧农业中的害虫精准检测提供了创新解决方案,对实现可持续农业发展具有重要意义。
Conclusion
本文通过设计CAEM边缘感知模块、BGM边界引导模块等创新组件,构建了专注于边缘定位和背景去噪的多层特征融合网络MENet。实验证明该方法能有效提升复杂背景下伪装目标的检测性能,特别是在保持目标边界完整性和抑制背景干扰方面表现突出。
生物通微信公众号
知名企业招聘