基于双重注意力机制的ATrans算法:提升单目标跟踪的鲁棒性与效率

【字体: 时间:2025年08月02日 来源:Journal of Visual Communication and Image Representation 3.1

编辑推荐:

  本文提出了一种基于双重注意力机制(Dual Attention)的新型目标跟踪框架ATrans,通过嵌入双重注意力模块增强特征提取鲁棒性,结合在线更新机制解决长时跟踪中的目标漂移问题,并引入背景去除模块优化计算效率。该研究在Lasot、Got10k等大型数据集上验证了其优越性能,为计算机视觉(CV)领域的Transformer应用提供了创新思路。

  

亮点

我们提出ATrans——首个完全基于Transformer的目标跟踪器,其核心创新包括:

  1. 双重注意力机制:在传统注意力模块中嵌入新机制,通过关联向量共识增强特征相关性,抑制错误关联;

  2. 动态在线更新:编码器中加入模板更新机制,应对长时跟踪中目标外观变化(如遮挡);

  3. 背景剔除模块:自适应丢弃无关背景区域,降低30%计算量(实测参数)。

整体框架

模型由Transformer主干和预测头组成:

  • 编码器-解码器结构:输入图像分块后经N层编码器(含双重注意力)和1层解码器处理;

  • 双参考策略:首帧作为长期参考,中间帧作为短期参考;

  • 定位头:轻量化设计实现实时边界框回归(128×128模板+320×320搜索区)。

实施细节

  • 开发环境:Python 3.9.7 + PyTorch 1.13.0CUDA116

  • 骨干网络:ImageNet-1k预训练的ResNet-50

  • 数据增强:亮度抖动+水平翻转

  • 训练:4×RTX3090显卡,100epoch(约48小时)

结论

ATrans通过双重注意力机制和动态更新,在Lasot数据集上实现89.3%成功率(较TransT提升2.1%)。背景剔除模块使推理速度达45FPS,为医疗影像分析(如细胞追踪)和自动驾驶等场景提供高效解决方案。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号