面向受监管测量仪器的黑盒软件一致性验证:机器学习解决方案的探索与性能评估

《IEEE Open Journal of Instrumentation and Measurement》:An Investigation of Machine Learning Solutions to Demonstrate Black Box Software Conformity in Regulated Measuring Instruments

【字体: 时间:2025年11月18日 来源:IEEE Open Journal of Instrumentation and Measurement 1.5

编辑推荐:

  本文针对受监管测量仪器中软件功能难以在黑盒场景下验证的问题,提出一种基于被动自动机学习的扩展算法,能够在不访问软件内部的情况下通过输入轨迹集学习其行为模型。研究进一步结合人工神经网络,探索了从行为与计量双维度实现软件功能通用识别的机器学习新途径,为法律计量等领域的自动化一致性评估提供了理论框架与实践基础。

  
在现代工业与计量领域,受法律监管的测量仪器(如电表、出租车计价器、长度测量仪等)日益依赖复杂软件驱动简单硬件传感器工作。为确保这些仪器在商业和官方应用中的准确性与可靠性,欧盟《测量仪器指令》(Measuring Instruments Directive, MID)要求制造商必须通过一致性评估程序,证明其产品符合法规要求。传统方法主要依赖对软件版本号和可执行文件哈希值的验证,然而,当软件功能对监管机构不透明(即处于“黑盒”状态)时,此类方法便难以有效监控软件在实际使用中的行为一致性。尤其面对频繁的软件更新,重新进行全量认证会带来高昂的成本与效率瓶颈。因此,开发一种能够在黑盒条件下验证软件功能一致性的新方法,成为法律计量(Legal Metrology)及相关监管领域的迫切需求。
为解决这一挑战,来自德国国家计量研究所(PTB)及柏林工业大学的Levin Ho、Marko Esche、Martin Nischwitz和Sabine Glesner组成的研究团队,在《IEEE Open Journal of Instrumentation and Measurement》上发表了一项研究,系统探索了多种机器学习方法在受监管测量仪器软件一致性验证中的应用。他们重点扩展了被动自动机学习(Passive Automata Learning)算法,使其能够仅通过外部提供的输入-输出轨迹集来推断软件的行为模型,而无需直接访问软件代码或内部状态。此外,作者还创新性地提出将自动机学习与监督训练的人工神经网络(Artificial Neural Networks)相结合,以同时覆盖软件的“行为功能”(如状态转换逻辑)和“计量功能”(如测量精度、时序特性),为实现软件功能的通用识别(General Functional Identification)提供了全新思路。
为开展研究,作者主要采用了以下几项关键技术方法:首先,基于有限状态自动机(Finite State Automata, FSA)对受监管测量仪器(以德国网络技术兼容电表Ferraris-Barrier-Meter, FBM为例)的软件行为进行建模;其次,扩展了被动自动机学习算法(如RPNI算法),通过构建前缀树接收器(Prefix Tree Acceptor, PTA)并优化基础前缀(Basis Prefixes)定义,以减少学习所需轨迹数量;第三,利用真实世界的FBM仪器进行算法实现与性能测试,记录学习时间、状态发现数量等指标;第四,引入有监督训练的长短期记忆网络(Long Short-Term Memory, LSTM)来处理时间序列数据,以识别软件的计量功能;最后,通过理论分析与实验比较,评估所提出方法在行为识别与计量识别方面的有效性与可行性。

扩展的准黑盒算法及其实现

研究团队对经典被动自动机学习算法进行了重要扩展。传统方法需要提供大量正例轨迹(S+)和负例轨迹(S-)来构建行为模型,效率较低。本研究通过定义每个输入符号的“基础转移”(Basis Transition),显著减少了所需的输入轨迹数量。例如,对于FBM电表,输入符号r在任何状态下都会触发向状态R的转移,因此只需定义一个基础前缀即可推断所有相关转移,无需为每个状态单独提供轨迹。对于可能触发不同转移的输入符号(如e0),则通过补充特定轨迹(如从状态E1触发自转移的轨迹)来确保模型完整性。算法最终仅需49条输入轨迹即可完整学习FBM的10状态行为模型,相比最坏情况下的100条轨迹,效率提升显著。

分析与讨论

性能测试表明,扩展后的被动学习算法在标准处理器(Intel Core i5-10210U)上完成一次完整的FBM模型学习与一致性测试仅需约3.3秒,其中PTA构建约0.92秒,一致性检查约2.42秒,状态发现准确率为100%。与主动自动机学习算法(如LM*算法)相比,虽然学习时间更长(约为20倍),但被动算法的核心优势在于实现了真正的黑盒测试——监管机构无需任何软件访问权限,仅凭制造商提供的轨迹集即可进行一致性验证。研究还对比了加密哈希、主动学习、被动学习及人工智能等不同软件识别方法(如下表所示),指出被动学习在准确性(>90%)、效率(<5秒)及黑盒适应性方面的综合优势,尤其适合对频繁更新且需保持功能不变的仪器进行远程监控。

面向软件通用功能识别的机器学习解决方案

为实现对软件行为与计量功能的双重识别,研究提出了一种新颖的机器学习解决方案。该方案包含两条并行学习管道:管道(i)专注于计量功能识别,首先使用监督训练的AI模块(如LSTM网络)对仪器的时间序列功能(如系统日志更新模式)进行预测,生成非确定性的输入-输出关系;随后,将这些预测结果处理成可被自动机学习算法识别的确定性轨迹集,进而通过被动学习推断出一个表示时间序列功能的定时自动机(Timed Automaton)。管道(ii)则沿用扩展的被动自动机学习算法,直接学习软件的行为功能模型。最终,将两个管道学习到的模型进行拼接,形成一个能够同时识别软件行为与计量功能的通用机器学习模型。
概念验证通过一个简化的日志组预测数据集(源自真实仪器日志)进行。研究演示了如何将AI预测的不规则时间序列(如日志组0,1,2之间的转移)转化为具有规则时间计数器的定时自动机模型。例如,通过定义“每2n个时间步长从状态0转移到状态2”等规则,构建了能够近似表示时间依赖行为的确定性模型。这证明了行为-计量联合识别思路的可行性。

结论与展望

本研究系统评估并扩展了被动自动机学习算法在受监管测量仪器黑盒软件一致性验证中的应用。实验证明,该算法能够在无需软件内部访问的前提下,高效、准确地学习软件行为模型,为监管机构提供了一种实用的远程监控工具。进一步提出的行为-计量联合识别机器学习框架,为实现软件功能的通用识别奠定了理论基础,尽管当前方案在处理复杂时间模式和非确定性行为方面仍存在局限。
该研究的重要意义在于:首先,为法律计量等领域提供了一种可在黑盒条件下进行软件一致性测试的新方法,降低了监管成本;其次,通过融合自动机学习与人工智能,探索了软件功能识别从单一维度向多维度发展的新路径;最后,研究结果为未来将此类方法纳入国际标准(如WELMEC软件指南)提供了理论依据与实践参考。未来工作将集中于优化算法以处理不规则时间模式、整合概率性自动机学习应对非确定性行为,以及提升联合识别框架的成熟度,最终推动自动化、高效率的软件一致性评估技术在更广泛工业场景中的应用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号