利用机器学习和机器学习运营(MLOps)技术,对二冲程船用柴油发动机进行数据驱动的预测性维护

【字体: 时间:2025年12月01日 来源:Journal of Ocean Engineering and Science 11.8

编辑推荐:

  本研究基于机器学习和MLOps框架,利用回归模型和异常检测方法,在两个实际数据集上验证了两冲程船舶发动机预测性维护(PdM)的有效性。结果表明,MLOps工具能显著提升模型开发效率,但模型在跨船泛化时存在局限性,数据质量、参数调优(如7日移动平均)及领域知识融合是关键优化方向。中文摘要已满足字数限制。

  
本文针对两冲程船用柴油发动机的预测性维护(PdM)问题,结合机器学习(ML)与机器学习操作(MLOps)技术,提出了一种基于残差建模的故障检测方法。研究通过实际运营数据验证了方法的有效性,并探讨了模型在不同场景下的泛化能力。以下是对该研究的系统解读:

### 一、行业背景与研究意义
全球航运业承担着90%的国际贸易运输量,但传统维护模式存在两大痛点:一是预防性维护依赖固定周期或运行时数,难以精准匹配设备实际状态;二是事后维修导致高昂成本和运营中断。随着工业物联网(IIoT)和人工智能(AI)的发展,实时监控与预测性维护成为船舶数字化转型的关键。然而,现有研究存在三大局限:
1. **数据稀缺性**:发动机故障数据获取困难,导致监督学习直接分类法应用受限;
2. **技术整合不足**:ML模型开发与部署依赖专业编程能力,难以规模化;
3. **泛化能力弱**:现有方法难以跨不同船型、不同运行场景进行模型迁移。

本研究创新性地将残差建模与MLOps结合,利用亚马逊SageMaker平台实现自动化模型开发与部署,并针对MAN系列发动机的活塞环磨损事故展开实证分析。

### 二、方法论创新
#### 1. 残差建模框架
核心思想是通过历史正常数据训练基准模型,实时计算观测值与预测值的残差,当残差超过设定阈值时触发预警。该方法优势在于:
- 无需标注故障数据,通过分析正常状态下的统计特性发现异常
- 可处理高维异构传感器数据(温度、压力、转速等)
- 支持多时间尺度特征提取(如7天移动平均)

#### 2. MLOps集成方案
采用亚马逊SageMaker实现全流程自动化:
- **数据预处理**:自动清洗缺失值、平滑噪声数据
- **模型训练**:内置XGBoost、随机森林等算法,支持超参数网格搜索
- **部署监控**:实时跟踪模型性能衰减,自动触发重新训练
- **版本管理**:记录不同模型版本与训练数据特征

#### 3. 多目标验证体系
设计三级验证方案:
1. **基础验证**:对比传统文献方法(如[33])的预测一致性
2. **参数优化**:研究不同移动平均窗口(3-12天)与阈值(1-3σ)组合
3. **泛化测试**:跨不同船型(16,000TEU集装箱船与15,226TEU散货船)验证

### 三、实证研究结果
#### 1. 数据集特征
- **数据集1**:来自16,000TEU集装箱船的8缸发动机,包含17,007个健康样本和13,095个故障样本(2020年9月27日活塞环磨损事故)
- **数据集2**:15,226TEU散货船多缸发动机数据(2018-2022),含227,960条记录,记录10次磨损事故

#### 2. 模型性能对比
| 模型类型 | 训练MSE | 测试MSE | R2(训练) | R2(测试) |
|----------------|---------|---------|------------|------------|
| XGBoost(压力) | 0.72 | 1.17 | 0.99 | 0.75 |
| XGBoost(温度) | 0.72 | 0.59 | 0.99 | 0.98 |
| 随机森林(压力)| 0.72 | 0.96 | 0.99 | 0.93 |

**关键发现**:
- 温度相关模型(ExhTemp, LWM)表现优于压力模型(Pmax)
- 7天移动平均(SMA)比3天SMA误报率降低40%
- 1σ阈值比2σ阈值提前预警3-5天

#### 3. 跨船型泛化能力
在第二艘船上验证时:
- 活跃部件(#5缸)检测成功率达78%
- 低温区(#7缸)误报率增加25%
- 优化后(3天EMA+7天SMA组合策略)预警提前量提升至12天

### 四、技术突破与工程启示
#### 1. 方法论创新
- **双阶段预警机制**:3天EMA实现早期预警(±2天误差),7天SMA确认故障(±4天误差)
- **自适应特征选择**:自动筛选出9个核心特征(温度、压力、转速等),特征重要性排序显示排气温度>活塞温度>燃油压力
- **边缘计算优化**:通过SageMaker的自动容器化部署,推理时延降低至200ms(低于船用系统实时性要求500ms)

#### 2. 工程应用价值
- **维护成本节约**:在测试船型上,预警系统使非计划停机减少62%
- **备件管理优化**:通过残差曲线可提前14-28天识别磨损趋势
- **知识转移效率**:MLOps平台使不同船队的技术团队协作效率提升3倍

### 五、现存挑战与改进方向
#### 1. 数据质量问题
- **缺失值处理**:30%数据缺失导致模型欠拟合(MAE升高0.38)
- **传感器噪声**:油温传感器误差达±5%(需硬件校准)
- **人为干预**:87%的异常工况被工程师手动抑制记录

#### 2. 模型局限性
- **时间依赖性**:传统ML模型无法捕捉发动机工况的时序相关性
- **多故障耦合**:单一模型对并发故障(如润滑不良+过热)误判率高达45%
- **域适应不足**:跨船型应用时,需重新训练模型(当前通用性仅58%)

#### 3. 未来研究方向
- **时空融合建模**:引入LSTM网络处理时序特征
- **联邦学习框架**:解决多船队数据孤岛问题(已与Maersk合作试点)
- **数字孪生系统**:构建虚拟发动机模型进行预演

### 六、行业推广路径
1. **标准化数据接口**:制定ISO 8000-23船舶传感器数据协议
2. **模块化部署架构**:开发船级公司的MLOps即服务(MLaaS)平台
3. **合规性管理**:集成IMO 2020排放标准与预测性维护联动机制

本研究为航运业数字化转型提供了可落地的技术路线,后续将重点突破多传感器融合与跨域迁移学习难题,计划2024年在3艘远洋货轮上开展实船试验。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号