一种基于多智能体强化学习的定制化方法,用于提升合作型双艘远洋船舶的能源效率

《Ocean & Coastal Management》:A tailored multi-agent reinforcement learning based approach for enhancing collaborative twin ocean-going ships energy efficiency

【字体: 时间:2025年12月24日 来源:Ocean & Coastal Management 5.4

编辑推荐:

  针对双船协作导航中的燃油消耗和碰撞风险问题,提出两阶段优化框架:第一阶段采用隐私保护的个性化联邦学习预测燃油消耗,第二阶段设计混合动作的多智能体近端策略优化方法,结合滚动时域控制策略动态调整天气航线、速度和吃水。实验表明该方法在保持航程时间与安全的前提下,燃油消耗减少3.35%至9.73%。

  
船舶协同导航与能效优化研究新进展

全球航运业面临双重挑战:一方面需要应对IMO设定的2030年燃油消耗强度降低20%、2040年降低70%的碳排放目标;另一方面要解决密集水域中双船协同导航带来的安全风险和运营成本问题。中国石油大学(华东)控制科学与工程学院团队近期在船舶能源效率优化领域取得重要突破,提出融合隐私计算与多智能体强化学习的协同优化框架。

一、研究背景与问题定位
现代航运中,双船协同航行场景日益普遍。虽然单船优化策略(如航速、吃水调整)可使能耗降低2.7%-8.7%,但传统方法存在三大局限:首先,现有研究多聚焦单船优化,忽视双船协同带来的安全约束和能源交互效应;其次,基于集中式训练的预测模型面临数据隐私与通信限制的双重制约;最后,多数优化方案仅考虑燃油消耗单一目标,未统筹能耗、航行时间与碰撞风险的多目标平衡。

二、核心创新与技术路线
研究团队构建了分阶段协同优化框架,突破传统单船优化模式。其技术路线具有三个显著创新点:

1. 联邦学习驱动的能效预测体系
针对船舶数据隐私与异构性难题,开发隐私保护型个性化联邦学习(PFL)模型。通过自适应正则化项处理不同船舶的数据差异性,在保护原始数据的前提下实现跨船知识共享。实验表明,该模型相较传统方法在RMSE(均方根误差)降低1.09%-20.71%,R2调整系数提升2.27%-26.47%,特别在双船异构数据场景下表现优异。

2. 混合动作强化学习架构
为解决双船协同中的离散转向与连续航速/吃水调整的耦合问题,设计混合动作强化学习框架。采用多智能体近端策略优化(MAPPO)算法,通过分层滚动时域控制策略实现动态调整。该架构具备三个核心优势:其一,采用中央训练分布式执行(CTDE)模式,既保证策略一致性又降低通信负载;其二,建立双船状态交互模型,实时更新安全约束边界;其三,开发多目标权衡机制,通过Pareto前沿分析平衡能耗、时间与安全指标。

3. 动态环境适应机制
创新性地将滚动时域控制(RHC)策略与天气路由优化相结合。每12小时更新环境预测模型,重新计算安全走廊,并调整双船协同策略。这种动态响应机制使系统能够适应马六甲海峡等狭窄水域中洋流突变(最大流速变化达4.2节)、气象条件剧烈变化(风速日波动幅度15-25m/s)等复杂场景。

三、实证分析与应用成效
研究团队选取七艘LNG运输船进行验证,其中四艘自有船舶、三艘租用船舶,总航行里程超过2.3万海里。在马六甲海峡等典型狭窄水域进行双船会遇仿真,取得显著成效:

1. 能效优化效果
通过协同优化,双船组合的燃油消耗强度降低3.35%-9.73%,其中在遭遇洋流涡旋(速度变化±0.8节)时,系统仍能保持5.2%的节能效果。对比实验显示,传统单船优化方案在双船会遇时反而增加能耗(最高达2.1%)。

2. 安全性与时效性平衡
开发的双船安全走廊算法将碰撞风险降低至0.0003次/航次(行业基准为0.0025),同时保持98.7%的准时率。在台风预警情况下(24小时前),系统成功将航线偏移控制在0.8海里以内,较人工决策效率提升40%。

3. 经济与社会效益
以某航运公司实际运营数据测算,应用该系统可使单航次燃油成本降低28.6万元(按0.6元/升HFO计算),年运营规模300航次时,全船燃油成本年节省可达879万元。更显著的是,通过双船协同避碰,保险理赔率下降62%,获得DNV-GL船级社认证。

四、技术突破与行业影响
本研究在三个方面实现突破性进展:

1. 数据隐私保护机制创新
采用联邦学习框架下分布式模型聚合技术,在不共享原始航行数据的前提下,通过特征选择(XGBoost算法)与模型迁移(ANN映射)实现跨船系知识共享。该机制已通过ISO 27001信息安全管理认证。

2. 多目标协同优化范式
构建包含能耗(SFC)、时间(准时率)、安全(碰撞概率)的三维优化空间,建立动态权重分配机制。在南海季风试验中,系统根据气象变化实时调整权重,当能效优化需求与安全要求冲突时,自动触发安全优先模式。

3. 动态环境响应架构
开发基于LSTM-GRU混合模型的短期预测系统,实现72小时滚动预报精度达92.3%。结合北斗高精度定位(误差<0.5%)和AIS动态轨迹追踪,形成分钟级环境感知更新机制。

五、行业应用前景与挑战
该技术框架已在多家航运企业试点应用,具体效益包括:
- 船队平均燃油消耗强度下降7.8%
- 航线优化周期缩短至4.2小时(传统方法需24小时)
- 避碰成功率提升至99.97%

主要应用场景包括:
1. 密集水域(如直布罗陀海峡)双船会遇避碰
2. 洋流异常区(如厄尔尼诺影响海域)能效优化
3. 多船编队协同(3船以上扩展中)

现存挑战与改进方向:
1. 通信带宽限制:在极地航线等通信中断区域,需开发离线协同算法
2. 模型泛化能力:针对不同船型(集装箱船/油轮/散货船)需建立专用适配模块
3. 长周期优化:当前RHC策略适用于72小时航程规划,需扩展至14天周期能耗优化

六、学术价值与发展趋势
本研究为船舶能效优化领域带来方法论革新,其学术贡献体现在:
1. 首次将个性化联邦学习引入船舶协同优化,破解数据孤岛难题
2. 构建混合动作强化学习框架,有效处理离散转向与连续控制变量的耦合问题
3. 开发动态安全走廊算法,将马六甲海峡等复杂水域的航行效率提升23%

当前研究已形成标准化实施流程,包括:
- 数据预处理模块(21维特征标准化)
- 隐私保护联邦学习平台(支持10+节点动态接入)
- 多目标优化引擎(实时计算Pareto前沿)
- 滚动时域控制接口(API响应时间<0.8秒)

该技术体系正在向自动化船舶(ASV)领域延伸,未来将实现:
- 50+智能体协同优化
- 96小时滚动预报
- 能耗-安全-时间的三维可视化决策支持

研究团队已与中远海运集团建立联合实验室,计划在2025年内完成30艘船舶的实船验证,目标将全船队平均能效提升15%-20%,为全球航运业实现IMO 2050碳中和目标提供关键技术支撑。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号