用于故障检测的多尺度门控循环潜变量模型:处理非平稳时间序列数据中的不完整性问题

《The Knee》:Multiscale Gated Recurrent Latent Variable Model for Fault Detection with Incomplete Nonstationary Time Series

【字体: 时间:2025年10月28日 来源:The Knee 1.6

编辑推荐:

  非平稳时间序列建模与故障检测中,本文提出MGRLV模型,通过MVMD分解提取高频/低频特征,双链递归结构分别建模短/长期依赖,交叉尺度门控机制实现动态信息融合,结合变分推理处理缺失数据。实验证明其在Tennessee Eastman和燃煤电厂系统中检测准确率、抗缺失能力均优于现有方法。

  本文提出了一种针对非平稳时间序列的多尺度门控递归潜在变量(MGRLV)模型,以实现稳健且可解释的故障检测。在工业领域,非平稳时间序列的建模与监控一直是极具挑战性的任务,主要原因在于其复杂的多尺度动态特性和数据缺失问题的频繁出现。非平稳时间序列的统计特性会随时间发生变化,如均值、协方差和自相关等,这种变化通常表现为趋势(慢速和长期变化)和波动(快速和短期变化)两种形式。趋势通常由设备老化、环境变化或工艺漂移等因素引起,而波动则可能源于干扰、操作转换或控制调整。这两种动态特性的交互作用使得传统建模方法难以有效捕捉和分析。

为了应对这些挑战,研究人员已经开发了多种时间变化建模技术。例如,协整分析(CA)能够识别多变量时间序列中的长期关系,从而隔离出可能指示故障的短期偏差。在这一基础上,Chen等人提出了结合CA与动态PCA的CA-DVPCA方法,显著提升了非平稳过程中的波动相关故障检测性能。另一种方法是静态子空间分析(SSA),它通过时间延迟嵌入和协方差分解将数据分为平稳和非平稳成分,从而聚焦于短期动态故障的监测。动态SSA(DSSA)和指数SSA(ESSA)等扩展方法则通过放宽对积分阶数的假设,增强了其灵活性。此外,慢特征分析(SFA)通过最小化特征的时变性提取反映系统趋势的潜在变量,已被证明在跟踪渐进性故障方面非常有效。近年来,诸如概率动态SFA(PDSFA)和在线学习机制等改进方法进一步提升了SFA的时间适应性。

尽管这些方法在一定程度上缓解了非平稳数据带来的挑战,但它们各自也存在局限性。例如,CA在处理非线性或非协整数据时表现不佳;SSA对投影设置较为敏感;而SFA可能无法有效捕捉快速或局部化的异常。为了解决这些问题,近年来出现了多尺度建模方法,这些方法通常结合信号分解技术,如时频分析、小波变换和经验模态分解(EMD),将时间序列分解为低频(趋势相关)和高频(波动相关)模态成分。这些模态成分相较于原始数据更具局部平稳性,从而简化了其内在时间依赖性的提取,降低了对非平稳过程建模的复杂度。例如,Lan等人提出的趋势-周期变分自编码器(TPVAE)利用基于快速傅里叶变换(FFT)的频率分析,将低频趋势和短周期模态分离,以实现早期故障检测。Yu等人提出的多尺度内容解耦(MCD)框架则采用多通道编码器,提取稳定和不稳定成分,以提高故障定位的准确性。Wang等人开发的多尺度门控软测量(MGSM)模型结合了EMD和门控机制,以捕捉不同时间尺度之间的依赖关系。然而,这些模型仍面临诸多问题,如TPVAE依赖频率分离和顺序滤波,缺乏正交性和并行性,可能导致模态混叠;MCD框架采用相对静态的建模方式,未能明确建模不同时间尺度之间的变量依赖关系;MGSM虽然能够捕捉短期和长期动态结构,但其依赖于EMD,容易受到噪声干扰,且在多变量场景中可能产生不一致性。此外,现有模型大多缺乏明确且灵活的跨尺度门控交互机制,这对于选择性融合和有效调节信息至关重要。

除了建模问题,非平稳过程中还经常出现传感器数据缺失的情况,这通常由通信故障、设备故障或采样延迟等因素引起。数据缺失会破坏时间序列的连续性,从而影响多尺度特征的提取。现有的解决方案主要分为两类:一类是通过滑动窗口平均、K近邻(KNN)或期望-最大化(EM)等方法对缺失值进行插补;另一类则是通过潜在变量技术构建对缺失输入具有鲁棒性的模型,包括矩阵补全、卷积融合和变分推断等方法。例如,Zhang等人将CA与概率主成分分析(PPCA)相结合,以提取非平稳过程中的稳定共结构,从而提升对趋势扰动和数据丢失的适应能力。Huang等人提出了一种基于卷积神经网络的多尺度融合框架,使得模型能够在多速率采样条件下统一建模异步数据。MGSM模型还引入了双向缺失数据机制,以处理不同时间维度和变量维度上的缺失情况。然而,许多方法假设缺失数据具有一定的结构化模式,而实际工业环境中缺失数据往往是随机且不可预测的。此外,大多数方法缺乏概率框架来量化缺失数据带来的不确定性,这降低了模型的可解释性和可靠性,特别是在故障检测应用中。

针对上述建模和数据缺失问题,本文提出了一种新颖的MGRLV模型及其对应的故障检测框架。该模型结合了基于频率的分解、双链结构、变分推断和对缺失数据的感知机制,以实现对部分观测非平稳过程的稳健监控。MGRLV的主要贡献包括以下几个方面:首先,它采用双链递归结构,两个并行的记忆路径分别捕捉高频成分中的短期依赖性和低频成分中的长期依赖性,从而实现对多尺度动态的精确分解。其次,引入了任务驱动的跨尺度门控机制,使得短期链的信息能够调节长期表示,同时长期信息也能对短期表示产生影响,从而增强模型的可解释性和适应性。第三,通过变分推断对潜在变量进行建模,分别学习短期和长期动态信息的潜在分布,提高了生成能力和对非平稳及不确定条件下的鲁棒性。最后,采用基于掩码的多变量模态分解策略,确保从不完整数据中可靠地提取多尺度特征,而无需对缺失模式做出严格的假设。

为了验证MGRLV模型的有效性,本文在多个工业数据集上进行了实验评估,包括著名的田纳西东部化工厂(TE)过程和燃煤发电系统(CFPG)。实验结果表明,MGRLV在检测精度、误报控制和对数据丢失的容忍度方面均优于现有的先进方法。具体而言,该模型能够更准确地识别出多尺度动态中的异常情况,同时减少误报的发生率,从而在实际工业应用中提供更加可靠的决策支持工具。此外,通过构建三种互补的监控统计量,MGRLV实现了对不同时间尺度异常的全面检测。这些统计量分别基于潜在变量和重构误差,使得模型能够在多个时间尺度上进行有效的异常检测,提升了其在复杂工业环境中的适用性。

在模型构建过程中,本文借鉴了多变量变分模态分解(MVMD)和门控循环单元(GRU)等关键技术。MVMD是一种能够有效分离多变量时间序列中不同频率成分的信号分解方法,它通过自适应的模态分解策略,将信号分解为多个具有不同中心频率的模态成分,从而更好地捕捉多尺度动态。GRU则是一种适用于处理序列数据的递归神经网络(RNN)变种,它通过门控机制控制信息的流动,从而有效捕捉时间序列中的长期依赖关系。本文将MVMD与GRU相结合,构建了双链结构的MGRLV模型,以同时处理趋势和波动相关的信息。此外,本文还引入了跨尺度门控机制,该机制通过任务驱动的方式,实现不同时间尺度之间的信息融合与调节,从而增强模型的适应性和可解释性。

为了应对数据缺失问题,本文在MGRLV模型中嵌入了对缺失数据的感知机制。这一机制通过掩码策略对缺失数据进行处理,确保在不完整数据的情况下,模型仍能可靠地提取多尺度特征。与传统的插补方法相比,该机制不需要对缺失数据的模式做出假设,而是通过自适应的方式处理缺失值,从而提高了模型的鲁棒性和灵活性。同时,该机制还结合了变分推断方法,使得模型能够在不确定条件下进行有效的潜在变量建模,从而提升其在故障检测中的可靠性。

在实验部分,本文对TE过程和CFPG系统进行了详尽的测试和评估。TE过程是一个典型的工业过程,广泛用于研究和测试故障检测算法。CFPG系统则代表了另一种常见的工业场景,即燃煤发电过程。这两个数据集分别涵盖了不同的工艺流程和操作条件,为验证MGRLV模型的泛化能力和适应性提供了良好的基础。实验结果表明,MGRLV在检测精度、误报控制和对数据丢失的容忍度方面均优于其他方法。此外,该模型在不同时间尺度上的表现也较为均衡,能够有效识别出趋势和波动相关的异常情况,从而为工业系统的安全和高效运行提供支持。

在故障检测方面,本文提出了一种基于潜在变量和重构误差的三种互补监控统计量。这些统计量分别对应于不同时间尺度上的异常检测需求,从而使得模型能够全面覆盖各种类型的故障。潜在变量统计量用于衡量系统在不同时间尺度上的动态行为,而重构误差统计量则用于评估模型对数据的拟合能力。通过结合这两种统计量,MGRLV能够在多个时间尺度上进行有效的异常检测,提高其在复杂工业环境中的实用性。

此外,本文还对现有方法进行了全面的回顾和分析,指出它们在处理非平稳数据和缺失数据时的不足之处。例如,CA-DVPCA虽然能够有效捕捉短期依赖性,但在处理长期趋势时可能表现不佳;DSSA和ESSA在分离平稳和非平稳成分方面具有一定优势,但对投影设置较为敏感;PDSFA和在线学习机制则在跟踪渐进性故障方面表现出色,但可能无法有效捕捉快速或局部化的异常。相比之下,MGRLV模型通过引入多尺度分解、双链结构和跨尺度门控机制,能够更全面地捕捉非平稳过程中的多尺度动态,并有效应对数据缺失问题。

综上所述,本文提出的MGRLV模型为非平稳工业过程的故障检测提供了一种新的解决方案。通过结合MVMD、GRU、变分推断和对缺失数据的感知机制,该模型不仅能够有效捕捉多尺度动态,还能在数据缺失的情况下保持较高的检测性能。实验结果表明,MGRLV在多个工业数据集上均表现出优越的检测精度和鲁棒性,为工业系统的安全和高效运行提供了可靠的决策支持工具。未来的研究方向可能包括进一步优化模型的计算效率,提升其在大规模工业数据中的应用能力,以及探索更广泛的工业场景以验证其泛化性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号