基于复兴变换的迁移学习安全控制:几何解释与理论突破

【字体: 时间:2025年08月10日 来源:Neurocomputing 6.5

编辑推荐:

  本文提出了一种基于复兴变换(revived transformation)的迁移学习(transfer learning)安全控制方法,通过建立源系统与目标系统间的微分同胚映射(diffeomorphic mapping),实现了控制器在危险环境中的安全迁移。该研究首次从几何角度揭示了状态流形(state manifold)、向量场(vector field)与单参数变换群(one-parameter transformation group)之间的结构化关联,为强化学习(RL)在安全关键场景(如自动驾驶)的应用提供了理论保障。

  

亮点

本研究揭示了复兴变换在迁移学习安全控制中的几何本质,首次将欧几里得状态空间拓展为微分流形(differentiable manifold),为危险环境下的控制器迁移提供了理论基石。

贡献

本工作奠定了复兴变换迁移学习的几何基础:1)证明复兴变换在源系统与目标系统的状态流形间建立了微分同胚映射;2)揭示了该映射如何诱导两流形上向量场的结构化关联;3)构建了单参数变换群的传递关系,最终确保目标系统的安全稳定性。

迁移学习

标准迁移学习包含四要素:目标域????、目标任务????、源域????和源任务????。通过数据(????,????)学习函数????,并迁移至目标系统实现安全控制。

复兴变换的几何解释

给定微分同胚映射??与输入变换??,目标系统(2)被等价转化为新坐标系??下的系统(4)。复兴变换[23]的精妙之处在于:当变换后系统(4)与源系统(3)具有相同动态结构时,控制器可直接迁移,且安全约束通过流形间的几何关联自然保持。

算法实现

基于SAC(Soft Actor-Critic)框架,算法1实现了双阶段控制:1)在无约束源系统中训练RL策略;2)通过复兴变换构建目标系统的迁移策略。这种"先模拟后迁移"的模式完美规避了危险环境中的试错风险。

仿真验证

以四轮转向车辆(4WS)的横向稳定性控制为例,系统动力学模型(5)的状态向量??=[??,??]T(含侧偏角??和横摆率??)。仿真证明,复兴变换能保持安全约束集??={??|?(??)≥0}的几何特性,使迁移控制器在危险工况下仍能维持??max≤0.8 rad/s的硬约束。

结论

本研究不仅建立了复兴变换的几何理论框架,更开创性地将流形结构、向量场传递与李群作用相结合,为安全关键领域的RL控制提供了"训练无忧、迁移无忧"的全新范式。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号