一种基于形状片驱动的蒸馏生成方法,用于复合故障诊断中的泛化零样本学习
《Neurocomputing》:A Shapelet-Driven Distillation Generation Method for Generalized Zero-Shot Learning in Compound Fault Diagnosis
【字体:
大
中
小
】
时间:2025年08月09日
来源:Neurocomputing 6.5
编辑推荐:
零样本学习与形状元融合的复合故障诊断方法在GZSL框架下提出,通过信息增益引导的形状元筛选和位置敏感子距离度量提升语义表征的区分度和鲁棒性,结合生成对抗网络与多损失协同优化策略实现跨类特征对齐与分布蒸馏,有效解决单故障与复合故障共存的诊断难题。
旋转机械是现代工业中的关键组成部分,广泛应用于海洋工程、航空航天和交通运输等领域。由于其结构复杂,由多个相互关联的部件构成,如轴承和齿轮,旋转机械容易发生逐渐退化,进而导致故障耦合和复合故障的产生。这些复合故障对工业设备的可靠性和安全性构成了严重威胁,因此,开发有效的复合故障诊断技术对于保障工业系统的长期稳定性和操作安全至关重要。
随着工业自动化和智能化的快速发展,基于深度学习的复合故障诊断技术逐渐成为智能诊断研究的重要方向。深度学习模型具备自主学习数据与标签之间映射关系的能力,这使得它们在处理复杂故障模式方面展现出巨大潜力。然而,现有的深度学习方法在诊断性能提升上主要依赖于预定义的类别和大规模标注数据,这在实际工业应用中往往难以满足。一方面,旋转机械的高安全要求使得获取全面的复合故障数据变得困难;另一方面,数据标注成本高昂,限制了深度学习模型的训练和应用。相比之下,单一故障数据相对容易收集和标注,因此,利用已有单一故障知识来有效识别未见过的复合故障成为旋转机械故障诊断研究的关键课题。
零样本学习(Zero-shot Learning, ZSL)作为一种新兴的学习范式,突破了传统数据依赖的局限,为复合故障诊断提供了有前景的解决方案。ZSL通过利用已知类别的数据和相关领域知识,使模型能够在没有直接训练样本的情况下识别未知故障类别,从而实现泛化的故障诊断。最初,Lampert团队将ZSL扩展到计算机视觉领域,提出利用物体属性作为语义信息,以促进未知类别的识别。近年来,研究者们在构建具有高区分度的语义表示方面进行了大量探索。例如,Liu等人通过增强区分度、引入图建模和语义引导的注意力机制,显著提升了ZSL在图像识别任务中的性能。Chen等人提出的分层语义引导的视觉Transformer框架,通过语义感知优化了视觉特征提取过程,从而增强了视觉-语义对齐和模型泛化能力。这些研究为构建高质量的语义空间提供了宝贵的参考,尤其是在工业应用中。
尽管ZSL在复合故障诊断中展现出一定的潜力,但其在实际应用中仍面临诸多挑战。首先,许多现有方法依赖于经验阈值或基础信号处理特征,这些方法往往难以有效捕捉故障信号的内在结构,导致区分度较低,难以诊断复杂的故障模式。虽然基于神经网络的方法能够提取更具表现力的语义表示,但它们对数据分布变化高度敏感,难以建模动态信号模式,从而影响语义学习的稳定性。其次,大多数现有方法采用全局特征提取,缺乏对类间互信息的显式优化,这通常会导致语义冗余和故障类别间的交叉干扰,进而削弱模型的正交性和独立性。因此,构建具有高区分度、鲁棒性和正交性的故障语义仍然是提升ZSL在复合故障诊断中泛化能力的关键挑战。
针对上述问题,本研究创新性地将形状因子(Shapelet)的类别区分能力与频域建模相结合,提出了一种高质量的故障语义构建方法。形状因子作为波形分析概念的延伸,是一种能够有效捕捉特定故障类别时间结构模式的局部子序列。与全局特征或深度嵌入相比,形状因子在类别分离和局部结构表示方面具有显著优势,使其成为故障诊断中语义建模的理想选择。已有文献证实,形状因子在复杂工业场景中能够稳定地表示故障模式。例如,Li等人通过L2正则化构建了一个稳定的形状因子字典,Chen等人从贝叶斯视角出发解决了不确定性建模问题,而Wan等人则提出了一种引入先验知识的形状因子学习框架,以引导无监督发现更具故障信息的形状因子。在此基础上,本研究进一步探索形状因子在频域中的构建,以更有效地提取频谱结构特征,从而增强复合故障中混合成分的区分度。
此外,现有的基于ZSL的故障诊断方法通常假设测试集仅包含未知类别,这意味着在测试过程中遇到的所有故障类型都未被模型训练所覆盖。然而,在现实工程应用中,旋转机械的故障表现往往具有高度不确定性。在测试阶段,系统可能会同时遇到已知的单一故障数据和未见过的复合故障数据。由于通常无法提前确定某一故障属于单一类别还是复合类别,模型必须具备在已知和未知类别共存的情况下进行诊断的能力。因此,采用广义零样本学习(Generalized Zero-shot Learning, GZSL)框架成为必要,以确保模型在复杂场景下的鲁棒性和适应性。尽管GZSL在实际应用中具有重要意义,但目前相关研究仍较为有限,有效的解决方案尚未充分探索。
为了解决上述挑战,本文提出了一种基于形状因子的蒸馏生成(Shapelet-driven Distillation Generation, SDDG)框架。具体而言,本文开发了一种信息增益引导的形状因子提取(Information Gain Guided Shapelet Extraction, IGSE)策略,用于构建具有区分度的故障语义,其中多级采样和排序增强了语义的鲁棒性。同时,引入了一种位置敏感子距离(Position-sensitive Sub-distance, PSS)度量,以减少特征交叉干扰。此外,本文还设计了一种协同优化策略,将特征生成与分布蒸馏相结合,通过生成模型合成未知类别特征,利用特征对齐损失优化表示,以及通过逻辑表示空间映射连接已知和未知类别。结合分类损失,该方法显著提升了GZSL在复合故障诊断中的性能。本文的主要贡献包括以下几个方面:
1. 提出了一种基于形状因子的语义构建方法,通过引入频域依赖建模和复杂度匹配,确保构建的语义表示具有区分性、鲁棒性和正交性,从而增强已知和未知类别之间的区分能力。
2. 开发了一种基于特征生成和分布蒸馏的协同优化策略,通过在教师-学生网络中集成多种损失约束,提升GZSL分类中的分布一致性与泛化能力。
3. 设计了一个由形状因子驱动的语义构建模块(Shapelet-based Semantic Construction Module, SSCM)、特征分离模块(Feature Separation Module, FSM)、特征生成模块(Feature Generation Module, FGM)和分布蒸馏模块(Distributed Distillation Module, DDM)组成的模块化框架,使SDDG能够有效处理单一故障和复合故障,显著提升在GZSL框架下的故障诊断性能。
本文的其余部分结构如下:第二部分正式描述了研究问题;第三部分概述了所提出方法的整体框架;第四部分通过两个实验案例研究来评估所提出方法的有效性;第五部分总结了本文的主要发现,并展望了未来的研究方向。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号