MSPI-Net框架:一种基于新型优化器的多源物理信息融合方法,用于轴承的智能诊断和可解释性分析
《Expert Systems with Applications》:MSPI-Net framework: a novel optimizer-powered multi-source physical information fusion approach for intelligent diagnosis and interpretability of bearings
【字体:
大
中
小
】
时间:2025年08月07日
来源:Expert Systems with Applications 7.5
编辑推荐:
电气腐蚀故障的精准诊断方法及优化策略。提出融合多源物理信号(振动、电压、电流、温度)的MSPI-Net框架,创新设计特征融合模块、软阈值注意力残差收缩模块和基于牛顿法的优化器,结合t-SNE可解释性分析,有效解决高耦合、强噪声、长序列特征提取难题。
随着工业技术的不断发展,特别是电力电子技术的迅速进步,脉宽调制(PWM)技术在高功率变频电机驱动系统中得到了广泛应用。PWM的引入显著提升了系统的动态性能,但同时也带来了新的挑战。在高功率变频电机系统中,PWM会生成高幅值和高频的共模电压,这导致了轴承内外圈之间产生轴电压。当轴电压超过润滑膜的击穿阈值时,会引发润滑膜的击穿,从而产生轴电流,最终导致绝缘轴承的电气故障。这种故障通常表现为轴承表面的局部熔融,而机械负载和疲劳磨损的共同作用会加剧损伤,大幅缩短轴承的使用寿命。据统计,约有50%的电机故障是由轴电流引起的。因此,开发先进的故障诊断方法,对于监测和评估轴承健康状况,确保机械设备的长期可靠运行具有重要意义。
传统的故障诊断方法主要分为基于物理模型和信号处理技术两类。基于物理模型的方法依赖于先验知识和专家经验,这使得它们在复杂工况下的故障识别能力受限。而信号处理方法,如短时傅里叶变换(STFT)、小波变换(WT)和变分模态分解(VMD)等,虽然在机械系统中能够有效识别故障特征,但在处理高度耦合的机械系统时却面临挑战。在工业大数据时代,基于机器学习的数据驱动方法可以捕捉关键特征用于故障分类。尽管这些方法表现出良好的效果,但其性能高度依赖于手动提取和选择的特征质量。随着工业领域的快速数字化,基于深度学习(DL)的智能方法逐渐成为故障诊断的有前景解决方案。深度学习算法擅长从复杂、高维数据中提取丰富的特征信息,使其在智能运维领域具有高度相关性。卷积神经网络(CNN)及其变体,如一维卷积神经网络(1DCNN),是深度学习的重要分支,能够直接从复杂数据中提取关键特征。然而,CNN在捕捉单尺度空间特征方面存在局限,难以有效处理时间序列数据的时序特性。
为了更好地提取时间特征,循环神经网络(RNN)通过递归操作捕捉隐藏的序列模式,为时间序列数据的处理提供了一种可行的解决方案。然而,RNN依赖于前一时间步的输出,这在长时间计算中可能导致资源消耗过大,从而引发梯度消失或梯度爆炸的问题。幸运的是,长短期记忆网络(LSTM)和门控循环单元网络(GRU)有效解决了传统RNN在处理长期依赖问题时的不足。例如,Zhu等(2024)提出了一种基于多尺度LSTM网络和多头自注意力机制的自适应分阶段剩余使用寿命(RUL)预测方法,该方法在滚动轴承的RUL预测中表现出显著优势。Ni等(2023)则开发了一种新的健康指标,通过构建该指标并结合运行至故障的轴承数据集进行实验验证,以推断退化过程。这些时间网络在处理时间序列数据时能够提取更丰富的信息,但在处理长序列数据时仍面临挑战,如高计算复杂度和对噪声的敏感性。
Transformer模型因其在并行计算、捕捉长程依赖关系和学习全局特征方面的优势,迅速成为工业领域研究的热点。其并行化的编码器-解码器架构显著提升了神经网络处理和学习信息的效率。例如,Wang等(2024)提出了一种创新的神经-Transformer模型,实现了高精度和鲁棒的故障诊断,且计算开销较低。实验结果表明,该模型在多个基准测试中优于传统方法。Hou等(2024)则提出了一种轻量级的全球-局部并行Transformer模型,该模型在资源受限条件下实现了平衡的诊断性能。Zhou等(2024)构建了一个端到端的故障诊断框架,该框架利用稀疏Transformer和移位窗口机制以及动态阈值噪声抑制,实验结果在三个不同数据集上验证了其鲁棒性和高精度。此外,Duan等(2025)提出了一种基于时空模型的轻量级智能诊断框架,旨在更准确地识别电机绝缘轴承的故障。尽管Transformer模型在序列建模和自主聚焦于故障相关特征方面表现出色,但其结构复杂性仍然存在一定的局限,如Transformer的层级结构可能削弱不同网络层之间的特征信息融合,从而影响局部特征的学习。此外,多变量数据的嵌入方式可能降低模型对变量间相关性的保留能力,进而限制其捕捉关键故障特征的能力。
作为Transformer模型的一种新兴变体,倒置Transformer(ITransformer)采用了一种创新的倒置范式。与传统Transformer不同,ITransformer不将整个时间序列作为单一的嵌入,而是将每个变量的时间序列独立地作为令牌进行嵌入,使模型能够自主反映每个变量的数据变化。通过自注意力机制处理多变量之间的相关性,ITransformer在保持变量独立性的同时扩展了接收场。这种设计在长期序列预测和模式识别方面展现了优越的性能。例如,Fang等(2024)提出了一种新的特征捕捉模块,利用ITransformer提升时间序列数据的特征提取能力。Liu等(2025)则引入了一种包含多个学习模块的在线学习方法,这些模块通过指数增长的扩张因子逐步扩展卷积核的接收场,从而实现多尺度特征捕捉。Jiang等(2024)提出了一种基于当前信号的增强领域迁移深度模糊回声状态网络,用于旋转机械的故障诊断。尽管ITransformer在预测性能方面有了显著提升,但其庞大的参数规模导致了较高的计算资源需求,降低了模型的效率,使其在工业应用中部署困难。此外,该方法未能全面反映轴承系统的整体状态,且容易受到外部干扰的影响,因此,利用多传感器数据补充故障特征的故障诊断方法逐渐成为研究的重点。
为了克服单一数据源信息的局限性,研究人员正在利用多传感器数据以更全面地了解设备的健康状况,并构建多源信息融合模型,以获得更稳定和可靠的诊断结果。例如,Zhao等(2024)提出了一种模型辅助的多源融合超图卷积神经网络,用于解决EHA的少样本智能故障诊断问题。Yu等(2024)则提出了一种域属性和特征迁移网络,以统一的深度网络建模多源信息域,实现跨域故障诊断。Gao等(2024)开发了一种多源域信息融合网络,该网络结合了对抗迁移学习和多域间的细粒度信息融合,以利用丰富的特征信息捕捉广泛的知识。Lin等(2025)提出了一种无监督的多源信息域自适应方法,用于迁移故障诊断,该方法利用了信息融合增强的域自适应注意力网络。Zhong等(2025)提出了一种基于改进Sinc-Net的可解释性多源物理信息卷积网络(M?IPI Sinc-Net)。Liu等(2025)则提出了一种双分支特征匹配引导的多源域自适应集成模型。这些方法在两个公开案例中验证了其卓越性和稳定性。尽管这些方法在特征融合方面取得了有效成果,但它们往往忽略了传感器之间的相关性,当输入数据受到外部噪声影响时,这些模型的特征提取能力可能会下降,进而影响诊断效果。
绝缘轴承的电气故障诊断面临诸多挑战,其中一个重要问题在于其复杂的工况环境。绝缘轴承在运行过程中会受到交流电压、负载变化和时变影响等多种因素的作用,这些因素导致了故障数据中存在多源激励源、强故障相关性和高耦合效应。因此,仅依靠单一物理信号进行故障诊断难以准确捕捉故障特征,而多源物理信号的集成则成为解决这一问题的关键。此外,高功率变频电机系统融合了机械、电气和控制系统,导致了高度耦合的子系统,且具有显著的非线性特征。这种复杂性使得由轴承故障引起的瞬态脉冲特征容易被背景噪声掩盖,从而降低了故障特征的可见性。同时,冗余特征的存在也妨碍了特征提取的准确性,使得模型难以有效捕捉关键信息。
在处理绝缘轴承的多源物理数据时,需要面对大规模数据的管理与存储问题。将这些数据上传至云服务器对计算和存储资源提出了更高的要求,增加了能源消耗。因此,为了满足实际工程需求,有必要开发轻量级的基于Transformer的网络模型。然而,现有模型通常依赖于对整个数据集进行梯度优化,随着数据量的增长,这些方法面临可扩展性挑战。特别是在特征映射过程中,全局激活的使用会导致较高的计算开销,影响模型的运行效率。
为了解决上述问题,本文提出了一种创新的绝缘轴承智能诊断框架——MSPI-Net,该框架结合了多源物理信息与优化结构,旨在实现更高效、更准确和更可解释的故障诊断。本文的主要贡献包括以下四个方面:
首先,考虑到绝缘轴承在复杂工况下的运行特性,如交流电压、负载变化和时变影响,设计了一种新的特征融合模块。该模块通过整合振动、轴电压、轴电流和温度信号,解决了单一数据源信息不足以准确表征绝缘轴承状态的问题。通过这一模块,MSPI-Net能够捕捉多源物理信号之间的交互特征,从而更精确地反映绝缘轴承的健康状况。
其次,为了应对绝缘轴承故障数据中固有的强噪声和冗余特征问题,开发了一种深度残差收缩模块。该模块将软阈值函数嵌入到注意力机制中,并结合残差网络结构,从而有效提取关键特征并抑制冗余信息。基于残差学习原理,该模块增强了MSPI-Net框架的特征表示能力,为建模全局激活和恢复长期依赖关系提供了一种新颖的方法。
第三,针对电气腐蚀故障数据中时间特征提取不足的问题,引入了一种生物启发的时间信息融合模块。该设计简化了MSPI-Net的内部结构,提高了时间特征提取的效率。通过开发一种新的多变量时间序列标记策略,该研究突破了传统约束,实现了绝缘轴承故障诊断的创新应用。此外,为了处理机械负载的不确定性,本文还推导了一种受牛顿迭代方法启发的新优化器——YL-FNGD。该优化器利用局部二阶信息,实现了在MSPI-Net框架中的快速全局收敛,克服了现有优化器在计算复杂性方面的不足。
最后,为了提升模型的可解释性,采用t-SNE降维方法对MSPI-Net的决策过程进行可视化分析。这种方法能够提供对模型如何识别故障特征的透明理解,解决了现有模型在可信度和可靠性方面的长期问题。通过将决策归因于可解释的特征,本文为开发兼顾效率、可解释性和可靠性的模型提供了新的思路。该框架的鲁棒性和适应性在实际的绝缘轴承数据集上得到了验证,展示了其在工程应用中的巨大潜力。
本文提出的MSPI-Net框架在处理多源物理数据方面具有显著优势。通过将振动、轴电压、轴电流和温度信号进行融合,该框架能够更全面地反映绝缘轴承的运行状态。在特征提取过程中,深度残差收缩模块通过嵌入软阈值函数和结合残差网络结构,有效抑制了冗余特征的影响,同时增强了关键特征的表示能力。此外,生物启发的时间信息融合模块通过创新的多变量时间序列标记策略,提高了时间特征提取的效率,并通过新优化器YL-FNGD实现了快速全局收敛,降低了计算复杂度。最后,通过t-SNE降维方法,MSPI-Net不仅提升了模型的可解释性,还为实际工程中的健康管理和智能维护提供了有力支持。
实验部分采用了一种高功率变频双馈风力涡轮机轴承的数据进行分析,以全面验证MSPI-Net框架在绝缘轴承故障诊断中的有效性。通过MSPI-Net,能够从多源物理数据中学习到深层次的动态特征,从而实现精准的故障识别。整个智能识别过程分为五个步骤,包括数据采集、特征提取、模型训练、特征融合和结果分析。在实验设置中,构建了一个全面的绝缘轴承健康监测仿真测试平台,基于高功率变频FYKK16双馈风力涡轮机系统。该测试平台由五个主要模块组成:驱动系统、加载系统、被测绝缘轴承、数据测试系统和控制系统。被测绝缘轴承的型号为6330,数据测试系统型号为FK7001A。
为了评估MSPI-Net框架的有效性,本文引入了三维多类别混淆矩阵来可视化其与其他四种模型的诊断结果。分类结果如图7(a)至图11(a)所示。考虑到绝缘轴承样本在实际工程中常遇到的类别不平衡问题,本文还采用了接收者操作特征(ROC)曲线,以更全面地评估MSPI-Net框架在识别不同类型故障方面的性能。实验结果表明,MSPI-Net框架在多个测试条件下均表现出良好的诊断效果,具有较高的准确率和鲁棒性。同时,其在处理复杂工况和噪声干扰方面也展现了较强的适应能力,为实际工程中的绝缘轴承故障诊断提供了可靠的解决方案。
综上所述,本文提出了一种创新的绝缘轴承智能诊断框架MSPI-Net,通过多源信息融合、深度残差收缩、生物启发的时间特征提取以及新的优化器,有效解决了传统方法在故障识别中的局限性。该框架不仅提升了诊断的准确性,还增强了模型的可解释性和鲁棒性,为高功率变频风力涡轮机绝缘轴承的健康管理和智能维护提供了新的技术路径。此外,通过引入t-SNE降维方法,MSPI-Net能够提供对模型决策过程的透明理解,进一步推动了基于深度学习的智能诊断方法在工业领域的应用。未来的研究可以进一步探索该框架在不同工况下的适应性,并结合更多类型的传感器数据以提升诊断的全面性和准确性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号