具有时间感知能力和转换语义的图神经网络,用于可解释的预测性业务流程监控
《Expert Systems with Applications》:Time-Aware and Transition-Semantic Graph Neural Networks for Interpretable Predictive Business Process Monitoring
【字体:
大
中
小
】
时间:2025年11月11日
来源:Expert Systems with Applications 7.5
编辑推荐:
提出一种统一的图神经网络框架,结合局部prefix模型和全局注意力机制,引入时间衰减和语义边嵌入,提升业务流程监控的准确性和可解释性,实验表明在多个基准数据集上性能优越。
预测性业务流程监控(Predictive Business Process Monitoring, PBPM)旨在通过历史事件日志预测正在进行的案例中未来发生的事件。在这一领域,图神经网络(Graph Neural Networks, GNNs)因其能够捕捉过程数据中的结构依赖关系而备受关注。然而,目前基于GNN的PBPM模型仍然存在局限性,主要体现在对局部前缀子图和全局结构模型的依赖上,往往忽视了时间相关性和转换语义。本文提出了一种统一且可解释的GNN框架,从三个关键方面提升了现有技术的性能。
首先,我们比较了基于前缀的图卷积网络(Graph Convolutional Networks, GCNs)和基于完整轨迹的图注意力网络(Graph Attention Networks, GATs),量化了局部建模与全局建模之间的性能差异。通过这种方式,我们发现局部模型在捕捉长距离依赖性方面存在不足,而结构良好的全局模型能够恢复这些模式并实现更优的预测准确性。
其次,我们引入了一种新颖的时间衰减注意力机制,构建了动态、以预测为中心的窗口,强调时间相关的事件并抑制噪声。这一机制使得模型能够适应不同的序列长度和时间分散情况,优先考虑最近的事件,同时保留了有信息的历史信号。
第三,我们将转换类型语义嵌入到边特征中,使得模型能够对结构上相似但行为上不同的轨迹进行精细推理。这种设计支持对过程动态的更细致分析,从而提升预测性能和可解释性。
我们的框架还包括多层次的可解释性模块,提供多样化的注意力行为可视化方式。通过在六个不同衰减因子的基准数据集上进行评估,我们的模型在一致的全局设置下实现了具有竞争力的Top-k准确率和Damerau–Levenshtein分数。对衰减系数λ的单独分析确认了其在调整注意力中的作用,有效的λ值由时间结构和序列深度校准。
本文提出的框架在解决架构、时间性和语义性方面的不足方面取得了进展,提供了一个稳健、通用且可解释的解决方案,用于PBPM中的下一步事件预测。这种方法不仅提高了预测准确性,还增强了模型的可解释性,使领域专家能够追踪模型行为,理解注意力动态,并评估预测理由,从而支持模型诊断和流程改进。
从方法论的角度来看,本文的研究框架通过一个四阶段的建模流程逐步增强了模型对事件序列中时间和语义依赖关系的捕捉能力。首先,我们在截断的轨迹图上使用GCN进行局部学习,以捕捉短前缀的即时依赖关系。这种方法虽然简单,但能够利用事件级别的属性和序列级别的特征,为后续模型提供强有力的基线。
其次,我们使用GATs对完整轨迹图进行建模,使得模型能够从完整的轨迹上下文中进行逐步的下一步事件预测,捕捉长距离依赖关系和上下文结构。这一设计支持在全局注意力机制下进行建模,从而提升了模型的整体表现。
第三,我们引入了基于全局时间距离的指数衰减机制,构建了动态的、针对每个案例的时间衰减注意力窗口。这种机制强调了近期事件,同时减弱了较早事件的影响,使得模型能够更好地适应不同时间跨度的数据。我们还引入了包含语义转换嵌入的GAT模型,使得注意力机制能够同时考虑时间接近性和行为转换语义。
第四,我们构建了多层次的可解释性模块,使得模型不仅能够暴露注意力权重,还能够可视化注意力的各个组成部分,包括原始注意力对数、时间衰减项和语义转换贡献。这种设计使得模型在不同阶段的注意力变化更加透明,增强了模型的可解释性。
在实验部分,我们对六个基准数据集进行了评估,包括BPI12、BPI12W、BPI13i、BPI13c、BPI20和Helpdesk。这些数据集来自多个行业的真实业务流程,涵盖了不同的时间跨度、过程复杂性和属性丰富性。通过使用这些数据集,我们验证了模型在不同场景下的表现,并观察到时间衰减机制在某些数据集上的显著优势。
在实验分析中,我们发现时间衰减机制在序列长度适中、时间跨度较大的数据集上表现尤为突出,如BPI13i。在这些数据集中,时间衰减机制使得模型能够有效地过滤掉无关的历史信息,从而提升预测性能。然而,在某些情况下,如BPI20,由于类空间较大、事件级特征稀疏,长前缀GCN表现优于GAT模型。
此外,我们观察到在不同数据集上,时间衰减系数λ的最优值有所差异。例如,在BPI12和BPI12W数据集上,λ=0.7表现最佳;而在BPI13i上,λ=0.3效果更佳;BPI13c上,λ=0.1效果最好;Helpdesk和BPI20数据集上,λ=0.01表现更优。这些结果表明,λ的选择必须根据数据集的时间结构进行校准,以实现最佳性能。
在可解释性分析中,我们展示了注意力机制如何在不同时间跨度下动态调整,使模型能够聚焦于近期且语义相关的事件。通过热图、关键窗口图和定量总结,我们能够直观地看到注意力在不同序列长度下的分布和变化,从而揭示模型如何在不同的时间语境下做出预测。
此外,我们分析了边类型嵌入对注意力动态的影响。结果表明,边类型嵌入能够显著提升模型的预测性能,尤其是在结构上存在歧义的轨迹中。通过结合时间衰减和语义转换嵌入,模型能够更全面地捕捉事件之间的关系,从而提升预测的准确性和可解释性。
在比较分析中,我们的模型在六个基准数据集上实现了优于先前方法的Top-1准确率和Damerau–Levenshtein分数。例如,在Helpdesk数据集上,我们的模型表现尤为突出,准确率达到了0.9584,显著高于其他方法。这一结果表明,我们的模型在捕捉事件序列的整体结构和语义转换方面具有显著优势。
本文提出的模型不仅提升了预测性能,还通过可解释性模块增强了模型的透明度和实用性。这些模块使得领域专家能够更直观地理解模型的行为,从而支持实际应用中的模型诊断和流程优化。通过这种设计,我们的框架为PBPM提供了一个稳健、通用且可解释的解决方案,使得模型能够适应不同的业务流程场景。
尽管本文提出的模型在多个方面取得了进展,但仍存在一些局限性。例如,我们对大部分超参数进行了全局固定,以确保模型之间的可比性。然而,更全面的超参数优化可能进一步提升模型的性能。此外,我们使用了一种统一的编码方式来处理所有数据集中的分类特征,这种做法虽然保证了公平和可控的比较,但可能限制了模型的表达能力。未来的研究可以探索其他编码策略,如嵌入或基于频率的编码,以评估哪些模型架构能够从更丰富的特征表示中获益。
总之,本文提出的统一、可解释的GNN框架在提升PBPM模型的预测性能和可解释性方面取得了显著进展。通过结合时间衰减机制和语义转换嵌入,模型能够更有效地捕捉事件序列中的关键信息,从而在不同的业务流程场景中实现更稳健的预测。这些成果不仅推动了预测性业务流程监控的发展,还为实际应用提供了更可靠的工具和支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号