
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于双重注意力机制的ATrans算法:提升单目标跟踪的鲁棒性与效率
【字体: 大 中 小 】 时间:2025年08月02日 来源:Journal of Visual Communication and Image Representation 3.1
编辑推荐:
本文提出了一种基于双重注意力机制(Dual Attention)的新型目标跟踪框架ATrans,通过嵌入双重注意力模块增强特征提取鲁棒性,结合在线更新机制解决长时跟踪中的目标漂移问题,并引入背景去除模块优化计算效率。该研究在Lasot、Got10k等大型数据集上验证了其优越性能,为计算机视觉(CV)领域的Transformer应用提供了创新思路。
亮点
我们提出ATrans——首个完全基于Transformer的目标跟踪器,其核心创新包括:
双重注意力机制:在传统注意力模块中嵌入新机制,通过关联向量共识增强特征相关性,抑制错误关联;
动态在线更新:编码器中加入模板更新机制,应对长时跟踪中目标外观变化(如遮挡);
背景剔除模块:自适应丢弃无关背景区域,降低30%计算量(实测参数)。
整体框架
模型由Transformer主干和预测头组成:
编码器-解码器结构:输入图像分块后经N层编码器(含双重注意力)和1层解码器处理;
双参考策略:首帧作为长期参考,中间帧作为短期参考;
定位头:轻量化设计实现实时边界框回归(128×128模板+320×320搜索区)。
实施细节
开发环境:Python 3.9.7 + PyTorch 1.13.0CUDA116
骨干网络:ImageNet-1k预训练的ResNet-50
数据增强:亮度抖动+水平翻转
训练:4×RTX3090显卡,100epoch(约48小时)
结论
ATrans通过双重注意力机制和动态更新,在Lasot数据集上实现89.3%成功率(较TransT提升2.1%)。背景剔除模块使推理速度达45FPS,为医疗影像分析(如细胞追踪)和自动驾驶等场景提供高效解决方案。
生物通微信公众号
知名企业招聘