OneN:用于自然可解释异常检测的引导式注意力机制
《Image and Vision Computing》:OneN: Guided attention for natively-explainable anomaly detection
【字体:
大
中
小
】
时间:2025年10月02日
来源:Image and Vision Computing 4.2
编辑推荐:
本文提出OneN统一架构,通过知识蒸馏将CNN教师网络的知识传递给ViT学生网络,整合异常检测、定位与分类。采用渐进式焦点损失优化注意力机制,提升局部异常定位精度。实验证明,该方案在工业数据集上有效,降低标注需求并支持高效部署。
在现代工业制造中,视觉检测技术正扮演着越来越重要的角色。随着人工智能(AI)的快速发展,它被广泛应用于提升生产效率、确保产品质量以及维护设备的正常运行。特别是在自动化检测系统中,AI技术能够有效识别产品中的异常,从而帮助工厂实现更高的质量控制标准。然而,传统的异常检测方法往往采用模块化设计,将分类、检测和定位任务分开处理,这种方式虽然简化了模型的开发过程,却也带来了诸多局限性。例如,在实际应用中,这种分离结构可能降低模型的泛化能力,并且在面对复杂或多样化的工业场景时,难以达到理想的检测效果。
面对这些问题,研究人员开始探索更为集成的解决方案,以期在单一模型中实现对异常的检测、定位以及分类。这不仅有助于减少计算资源的消耗,还能提高系统的整体效率。尤其是在工业环境中,由于数据标注的成本较高,且实际生产中可能缺乏足够的异常样本,因此,开发能够利用弱监督信息的模型成为了一个重要的研究方向。近年来,基于注意力机制的模型,如视觉Transformer(ViT),在图像分类任务中表现出色,其全局注意力机制使得模型能够捕捉图像中更为关键的特征。然而,这些模型在异常检测任务中仍面临挑战,尤其是在定位异常区域方面,以及如何在低资源环境中进行高效部署。
为了克服上述问题,本文提出了一种名为“OneN”的统一架构。该架构基于知识蒸馏(Knowledge Distillation, KD)技术,将一个高性能的卷积神经网络(CNN)的知识迁移至一个基于注意力的模型中。通过这种方式,OneN能够在单一模型中完成检测、定位和分类三项核心任务,从而实现更高的系统整合度和实用性。与传统方法不同,OneN不仅保留了CNN在小规模数据集上的优势,还利用了ViT的全局注意力机制,使其在处理复杂异常检测任务时更具灵活性和适应性。
在“OneN”框架中,注意力机制被用来生成可解释的伪分割掩码,从而帮助模型更准确地定位异常区域。这一过程通过引入一种新的“渐进焦点损失”(progressive focal loss)来优化,该机制能够引导模型在不同层级的注意力图中关注那些对异常检测最为关键的特征。此外,为了进一步提升定位性能,OneN还采用了合成数据生成的方法,通过先进的生成模型(如扩散模型)创建异常样本,并在训练过程中使用这些数据来增强模型的泛化能力。这种合成数据的使用不仅降低了标注成本,还能有效应对实际生产中异常样本稀缺的问题。
实验结果显示,OneN在多个标准化和自定义的工业基准测试中均表现出色。即使在弱监督条件下,该方法也能实现较高的检测准确率,并显著减少人工标注的工作量。同时,OneN的模型结构更加紧凑,使得其在低延迟和低能耗的工业环境中具有更强的适用性。这表明,OneN不仅在理论上具备优势,而且在实际应用中也展现出良好的效果。
此外,本文还探讨了如何利用合成图像进行异常检测,并定义了多种评估协议和输入设置,以反映真实工业生产中的复杂需求。通过与当前主流架构的对比分析,研究者们发现OneN在多个方面均优于传统方法,尤其是在处理弱监督数据和跨不同输入配置时的适应能力。这为工业界提供了一种更为高效、经济且可靠的异常检测解决方案。
综上所述,OneN的提出标志着工业视觉检测领域的一项重要进展。它不仅解决了传统方法中模块化设计所带来的局限性,还通过知识蒸馏和注意力机制的结合,实现了对异常的全面识别和定位。同时,该方法在弱监督条件下仍能保持较高的性能,为实际应用中的资源约束问题提供了有效的应对策略。未来,随着工业自动化程度的不断提高,OneN这样的统一架构有望在更多场景中得到应用,并推动工业检测技术向更智能化、更高效化的方向发展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号