面向多核系统的分解式神经网络最坏情况执行时间优化分区与分配策略

《IEEE Embedded Systems Letters》:WCET-Aware Partitioning and Allocation of Disaggregated Networks for Multicore Systems

【字体: 时间:2025年11月28日 来源:IEEE Embedded Systems Letters 2

编辑推荐:

  本文针对机器学习在安全关键信息物理系统中应用带来的计算挑战,提出了一种基于混合整数二次约束规划(MIQCP)的最坏情况执行时间(WCET)感知调度方法。通过神经网络的分解化处理构建稀疏依赖结构,结合分层分区和神经元分配优化,在保证精度的同时显著降低了多核平台上的WCET。实验表明分解网络可获得最高98.4%的WCET缩减(63.7倍加速),为实时系统神经网络部署提供了理论保障。

  
随着机器学习技术深度融入自动驾驶、工业控制等安全关键领域,现代嵌入式系统正面临日益严峻的计算压力。为满足持续增长的计算需求,多核架构凭借其并行处理能力成为主流选择。然而,复杂内存子系统的引入在提升效率的同时,也带来了时序可预测性的重大挑战——特别是当神经网络等计算密集型模型被部署到实时系统中时,其密集的数据依赖性和非局部内存访问会导致最坏情况执行时间(WCET)分析变得异常困难。
传统单体神经网络虽然功能强大,但其层间紧密耦合的特性严重限制了并行化潜力。每当数据需要在不同核心间传输时,缓存未命中带来的延迟惩罚会显著增加WCET的不确定性。这种时序特性的波动对于安全关键系统而言是不可接受的,因为它们必须确保所有任务在最恶劣条件下仍能满足严格的时间约束。
为解决这一核心矛盾,来自德国多特蒙德大学和新西兰奥克兰大学的研究团队开创性地提出了WCET感知的神经网络调度框架。该研究的创新点在于将神经网络分解(Disaggregation)概念与形式化调度方法相结合,通过混合整数二次约束规划(MIQCP)实现理论最优的资源配置。
如图1所示,研究团队通过系统实验证明,在保持精度的前提下(精度损失控制在2%以内),分解式神经网络结构能实现较单体网络更显著的WCET优化效果。
关键技术方法主要包括:1)建立局部性感知执行模型,量化数据局部性对WCET的影响;2)构建MIQCP优化问题,形式化描述神经网络层分区和神经元分配过程;3)设计启发式初始解生成策略加速求解;4)基于Room Occupancy Estimation数据集,通过模型优化(MBO)进行超参数调优;5)使用Gurobi求解器在48小时时限内获取最优调度方案。
系统模型与问题定义方面,研究团队将神经网络任务建模为有向无环图(DAG),其中神经元作为子任务,层间依赖关系由指示函数ID(·)精确描述。针对包含n个周期性任务的集合T,每个任务τi由其WCET集合Ci、周期Ti和相对截止时间Di定义。该系统模型为后续形式化分析奠定了理论基础。
WCET优化方法的核心创新体现在三个层面:在执行模型层面,通过WCETfull(ξ) = WCETbase + ξ·WCETpenalty公式量化数据非局部访问的代价;在优化建模层面,通过定义层级起止时间函数SPC(·)和FPC(·),构建包含神经元分配函数NLC(·)的完整约束体系;在求解加速层面,采用轮询分配启发式策略生成初始解,显著提升MIQCP求解效率。
实验评估部分展现了方法的显著优势。如图1(b)所示,在四核配置下,MIQCP调度器使分解网络获得较基线3-4倍的WCET缩减,单体网络也实现2-3倍提升。图1(c)进一步揭示核心数影响的规律:分解网络在3-5核处存在性能“甜点区”,而单体网络因缺乏独立分区而无法有效利用更多核心。这些发现为实际系统设计提供了重要参考。
本研究的意义在于首次建立了神经网络WCET优化与多核资源分配的理论桥梁。通过将神经网络结构特征(如分解化带来的稀疏性)转化为调度优势,不仅实现了量化的性能提升(最高98.4% WCET缩减),更开创了“算法-架构-时序分析”协同优化的新范式。该方法为高安全要求的智能嵌入式系统提供了兼具计算效率和时序可预测性的解决方案,对自动驾驶、工业物联网等关键领域具有重要应用价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号