《Knowledge-Based Systems》:A Framework for Mining CPS Specification Based on Neural Hybrid Automata
编辑推荐:
提出了一种数据驱动的神经混合自动机框架,通过多变量变化点检测和加权动态时间弯曲聚类,自动从未标记CPS轨迹中提取有限状态转移系统,并训练状态条件下的连续流和guards网络,实验验证了该方法在Simulink引擎定时基准上的有效性。
赵星|曹子宁|李振
南京航空航天大学计算机科学与技术学院,南京,211106,中国
摘要
信息物理系统(CPS)结合了连续动态和离散事件,这使得手动构建混合自动机变得成本高昂且容易出错。本文提出了一种数据驱动的框架,可以直接从未标记的多变量CPS轨迹中挖掘神经混合自动机(NHA)。该框架首先应用多变量变点检测和基于WDTW的段聚类,并使用复合的Silhouette+MDL标准来选择模式的数量,从而实现一个明确的有限状态转换系统。然后训练状态条件下的前馈网络来模拟连续流和允许转换的守卫条件,生成一个可执行且可审计的NHA。
该方法在Simulink引擎计时基准测试中进行了实例化,进行了数百次模拟运行。分组5折交叉验证和独立的盲测表明,该方法能够恢复结构一致的紧凑自动机,实现对引擎变量的低单步预测误差,并在守卫激活方面达到高精度和召回率。鲁棒性、超参数敏感性和可扩展性研究表明,该框架在中等传感器噪声下稳定,对大多数阈值不敏感,并且适合离线分析。案例研究结果表明,所提出的NHA挖掘流程为这类CPS基准提供了实用且可解释的数据驱动混合建模方法。
引言
信息物理系统(CPS)是集成数字和物理组件的复杂系统,表现出连续动态和离散事件行为[1]。这些系统在现代技术中非常普遍,应用范围从航空航天(控制飞机飞行系统)到医疗保健(管理心脏起搏器等关键生命设备)[2],[3]。准确建模CPS动态对于系统验证、控制和预测等任务至关重要,因为这些系统通常在安全关键环境中运行[4]。
混合自动机(HA)形式主义被广泛用于建模CPS[5]。混合自动机结合了流函数(代表由微分方程控制的连续行为)和状态变化(表示由特定条件触发的离散事件)[6]。这种形式主义捕捉了涉及连续过程(如车辆移动)和离散事件(如控制系统中的状态切换)的行为[7]。
然而,为复杂的CPS手动构建混合自动机往往容易出错且耗时,尤其是在处理高维时间序列数据时[8]。随着CPS变得越来越复杂,变量和交互的数量增加,手动建模变得越来越复杂[9]。事实上,即使是从观察数据中推断出一个最小的有限状态自动机也是NP完全问题[10],这突显了从轨迹中恢复离散结构的固有难度。这激发了尝试直接从多变量时间序列观测中学习混合模型的数据驱动方法[11]。
为了解决这一挑战,本文提出了一种规范挖掘框架,可以从原始CPS数据中自动学习神经混合自动机(NHA)。该框架整合了三个组件:变点检测将多变量轨迹分割成行为一致的阶段;段聚类发现一组离散状态;以及轻量级前馈神经网络,用于为每个发现的状态建模特定的连续演化(流函数)和决定转换何时何地发生的二进制守卫条件。与端到端的神经混合自动机不同,后者隐含地混合了连续动态和状态切换[12],所提出的方法使离散自动机变得明确:它生成了一个具体的、可审计的状态集和转换关系,并且仅在允许的转换上学习守卫函数。
本文的贡献包括:
1.提出了一种新的模型,该模型结合了一个明确的有限状态转换系统、一个捕获状态内连续演化的状态条件神经流网络,以及一个在允许的传出转换中提出候选后继者并发布校准激活决策的守卫网络。这些组件共同生成了一个明确、可执行的NHA。
2.开发了一个数据驱动的框架,首先通过分割和聚类推断出离散结构,然后使用模块化目标来拟合流和守卫网络——流的均方误差、后继状态分类的掩码交叉熵以及守卫激活的二进制交叉熵。
3.一种无监督程序使用趋势/残差线索和多变量验证以及递归细化将多变量时间序列分割成行为一致的阶段,生成的边界对时间抖动和局部干扰具有鲁棒性,并且与下游状态发现对齐。
4.基于加权动态时间弯曲(WDTW)的聚类阶段根据时间形态对段进行分组,在受控的弯曲惩罚下进行,状态计数选择由肘部候选者、WDTW轮廓指数和MDL风格的复杂性惩罚指导,以实现可复制的模型大小。
详细过程如图1所示。
本文的其余部分组织如下。第2节回顾了CPS建模的相关工作。第3节详细介绍了所提出的NHA框架。第4节提出了一个案例研究。第5节总结了未来的研究方向。
章节片段
相关工作
混合自动机是一种标准的形式主义,用于表示结合连续动态和离散状态切换的系统[5],[7]。已经出现了两种广泛的数据驱动方法来从轨迹中获得此类模型。(i) 被动识别流程将轨迹分割成不同的区域,并用简单的参数形式(通常是线性或低阶多项式)拟合局部动态,同时从段邻接性中推断转换结构[11],[13],[14]。(ii)
挖掘神经混合自动机框架
本节介绍了一个从数据中挖掘NHA的框架。该框架结合了变点检测、段聚类和神经网络模型,用于流函数和守卫条件,以获得CPS的可执行NHA表示。该框架的动机是需要建模那些行为受连续动态和离散逻辑规则共同控制的复杂CPS。在许多现实世界的CPS应用中,例如自动驾驶车辆控制、工业机器人技术等
实验
本节在一个标准的信息物理基准测试——Simulink引擎计时模型sldemo_enginewc上评估了所提出的NHA挖掘框架。所有实验都在配备了AMD Ryzen 5 5600X(6核,3.70 GHz)、32 GB RAM和NVIDIA GeForce RTX 3070 Ti的工作站上进行。
除了挖掘出的自动机的结构属性(模式数量和转换数量)之外,我们还报告了学习到的流函数的准确性、长时域预测以及守卫分类器的性能
结论
本研究提出了一个从原始时间序列数据中学习NHA的规范挖掘框架。该框架结合了多变量变点检测、基于WDTW的段聚类以及状态条件下的神经网络,用于流函数和守卫条件,以获得一个明确的、可执行的混合自动机。与端到端的神经混合自动机不同,后者将连续动态和切换逻辑混合在一起
CRediT作者贡献声明
赵星:撰写——原始草稿,可视化,验证,软件,项目管理,方法论,调查,形式分析,数据整理,概念化。曹子宁:撰写——审阅与编辑,验证,监督,资金获取,形式分析,概念化。李振:验证。
利益冲突声明
作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。
致谢
本研究得到了中央高校基本研究基金(Grant NJ2024030)和苏州大学数据智能与高级计算重点实验室开放基金的支持。