语义融合嵌入实现零样本智能故障诊断:突破传统局限,开启工业设备智能运维新篇

【字体: 时间:2025年05月06日 来源:Cognitive Robotics CS8.4

编辑推荐:

  在工业领域,传统故障诊断依赖实验室数据,难以适应复杂实际工况。研究人员开展基于零样本学习(ZSL)的故障诊断研究,提出深度故障语义融合嵌入模型(DFSFEM)。实验表明其诊断准确率高,为工业设备故障诊断提供新方案。

  在工业生产中,设备的稳定运行至关重要。然而,现有的故障诊断方法却面临着诸多挑战。以往大多数故障诊断研究都依赖于在实验室收集的人工数据,这些数据采集时的运行条件可控且稳定。但实际工业场景中的故障复杂多样,实验室数据根本无法涵盖所有可能的故障模式,这就导致传统的故障诊断方法在实际应用中效果不佳。比如,在不同的工业设备上,即使是同一种类型的故障,其表现出来的特征也可能大相径庭。而且,实际工况中的干扰因素众多,使得故障诊断更加困难。因此,寻找一种能够适应复杂实际工况的故障诊断方法迫在眉睫。
为了解决这些问题,研究人员开展了基于零样本学习(ZSL)的故障诊断研究。他们提出了一种新颖的深度故障语义融合嵌入模型(DFSFEM),旨在实现零样本智能故障诊断。这项研究成果发表在《Cognitive Robotics》上,为工业设备的故障诊断开辟了新的道路。

在研究过程中,研究人员主要运用了以下几种关键技术方法:

  1. 语义融合嵌入技术:通过定义故障语义,将故障的特征进行量化表示。利用神经网络将语义向量和时频特征向量融合,形成嵌入语义融合向量,增强了特征学习的跨域表示能力和适应性。
  2. 基于神经网络的度量模块:采用神经网络来测量语义向量与局部 / 全局特征之间的距离,取代了传统的距离测量方法。这种方式能够更准确地衡量向量之间的相似性,提高了模型的跨域传输能力。
  3. 损失函数优化:综合使用交叉熵损失函数、计算特征间最小均方误差的损失函数以及引入重建约束的损失函数,对模型参数进行迭代优化,提升模型的性能和泛化能力。

下面来看具体的研究结果:

  1. 模型构建:DFSFEM 模型主要由语义融合嵌入、关系测量和损失函数三个关键部分组成。
    • 语义融合嵌入:先对原始振动信号进行连续小波变换,生成时频特征图,再通过卷积层提取局部和全局特征。将故障类别的语义描述转化为语义向量,与提取的时频特征向量结合,经过全连接层处理,形成嵌入语义融合向量。这个过程通过公式(1)-(4)进行精确计算,确保了特征的有效融合和表示。
    • 关系测量:将嵌入语义融合向量与局部和全局特征进行合并,通过神经网络计算它们之间的关系得分。根据得分自适应调整特征权重,采用加权融合的方式得出最终的诊断结果。具体计算过程由公式(5)-(10)详细描述,这种方法能够充分利用不同层次的特征信息,提高诊断的准确性。
    • 损失函数:选用交叉熵损失函数,并结合计算局部、全局嵌入特征与融合特征之间最小均方误差的损失函数,以及引入重建约束的损失函数。这些损失函数分别通过公式(11)-(14)进行定义,它们从不同角度对模型进行优化,使得模型在训练过程中不断调整参数,提高对故障特征的表示能力和诊断准确性。

  2. 实验评估:研究人员使用凯斯西储大学(Case Western Reserve University,CWRU)和帕德博恩大学(Paderborn University,PU)的轴承数据集进行实验评估。
    • 实验设置:在 CWRU 数据集中,根据零样本学习原则,选取 6 种故障样本作为训练集,3 种作为测试集,并设计了 Task A 和 Task B 两个诊断任务。在 PU 数据集中,选取 9 种故障作为训练集,3 种作为测试集,设计了 Task 0 - Task 3 四个任务。同时,选择了 Embarrassingly Simple Zero-Shot Learning(ESZSL)、Stacked Auto-Encoder(SAE)、Fully Guided Network(FGN)和 Cross-aligned Variational Autoencoder(CADA-VAE)等先进的零样本学习方法进行对比实验。
    • 实验结果:在 CWRU 数据集上,DFSFEM 在 Task A 中平均故障诊断准确率达到 85.17%,其中 Task A_2 的准确率最高,为 88.67%;在 Task B 中平均准确率为 85.37%。在 PU 数据集上,DFSFEM 平均故障诊断准确率为 82.2%,其中 Task_2 的准确率最高,达到 85.7%。通过与其他方法的对比,DFSFEM 在两个数据集上均取得了最好的成绩,展现出其在零样本故障诊断方面的优越性。
    • 消融研究:对 DFSFEM 进行消融研究发现,融合语义特征和时频特征能够显著提升模型性能。去除语义特征会导致模型性能大幅下降,而去除时频特征虽然也会使性能下降,但语义特征在提升特征表示能力和故障诊断性能方面起着至关重要的作用。这表明 DFSFEM 的各个模块相互协作,共同提升了模型的性能。
    • 特征可视化:利用 t-SNE 技术对原始数据和学习到的特征进行降维可视化。结果显示,经过 DFSFEM 学习后,特征的类间变化减小,类内差异增大,说明该模型能够提取具有高代表性的故障特征,使不同故障类型之间的区分更加明显。


研究结论和讨论部分表明,DFSFEM 在零样本智能故障诊断方面表现卓越。该模型通过语义融合嵌入模块实现了特征的跨域转移,利用基于神经网络的度量模块提高了零样本学习性能。与其他对比方法相比,DFSFEM 在诊断准确性和适应性方面具有显著优势。同时,消融研究也验证了模型中不同模块的重要性。

这项研究的重要意义在于,它为工业设备的故障诊断提供了一种新的有效方法,能够在没有见过特定故障样本的情况下进行准确诊断,大大提高了故障诊断的效率和准确性,降低了工业设备的维护成本,保障了工业生产的稳定运行。而且,零样本故障诊断作为一个新兴的研究方向,为未来的研究指明了方向。后续研究可以进一步关注跨域特征映射等问题,不断完善和优化零样本故障诊断技术,推动工业领域的智能化发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号