
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于人类活动识别与时序分割的未剪辑视频阿尔茨海默病检测技术研究
【字体: 大 中 小 】 时间:2025年08月09日 来源:Neurocomputing 6.5
编辑推荐:
本文创新性地提出基于系统复活变换(revived transformation)的强化学习(RL)安全控制迁移方法,通过建立源系统与目标系统的微分同胚映射,构建了状态流形的几何框架,解决了危险环境下策略迁移的稳定性问题。研究首次揭示了变换公式与流形结构、向量场及单参数变换群的深层关联,为安全关键领域(如自动驾驶)的RL控制提供了理论保障。
亮点
本研究建立了复活变换迁移学习控制的几何基础,揭示了变换公式与空间几何结构的深层关联。
贡献
本工作奠定了复活变换迁移学习方法的几何基础:首先将欧氏状态空间视为一般微分流形,证明复活变换在源系统和目标系统状态流形间建立了微分同胚映射。该映射不仅诱导了两个流形上向量场的结构化关联,更构建了单参数变换群之间的内在联系。
迁移学习
标准迁移学习包含四要素:目标域、目标任务、源域和源任务。通过定义1(迁移学习),我们实现了从非危险源系统到危险目标系统的策略迁移。
复活变换策略迁移的几何诠释
给定微分同胚映射和输入变换,目标系统(2)在映射对下被等价转化为系统(4)。定义4(复活变换)表明,该变换通过坐标下的漂移矩阵和输入矩阵重构了系统动力学。
算法实现
基于SAC(Soft Actor-Critic)框架,算法1实现了源任务(学习稳定源系统的RL策略)与目标任务(构建目标系统迁移策略)的完整闭环。
仿真结果评估
以四轮转向系统(4WS)车辆横向稳定性控制为例(图2),系统状态T包含侧偏角β和横摆率γ。动力学方程(5)显示,复活变换成功将危险工况下的控制问题转化为安全域内的学习任务。
结论
本研究不仅建立了状态流形间的映射,更揭示了向量场与单参数变换群的传导规律,为安全关键系统的RL控制提供了新的几何视角。
生物通微信公众号
知名企业招聘