基于特征驱动双深度Q网络与迭代贪婪算法的可重入混合流水车间智能调度优化

【字体: 时间:2025年08月30日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  本文针对可重入混合流水车间调度问题(RHFSP)提出创新性解决方案FD3QNIG算法,通过建立五维混合整数线性规划(MILP)模型提升建模精度,结合特征驱动初始化(FDNEH)和自适应历史信息破坏重建策略(AHDDR)平衡探索与开发,首次将强制操作局部搜索(CED_MOLS)应用于RHFSP,并采用双深度Q网络(DDQN_ASS)实现动态策略选择。实验表明该算法在285个基准实例上平均相对百分比增长(ARPI)较现有方法提升53%-94%,为复杂制造系统调度提供了突破性方法。

  

Highlight亮点

本研究针对具有完全可重入特性的混合流水车间系统,创新性地将深度强化学习与元启发式算法融合,开发出具备自主决策能力的智能调度引擎。

Problem Description and Mathematical Model问题描述与数学模型

RHFSP系统包含n个工件需依次通过S个加工阶段,每个阶段s(s=1,...,S)配备ms≥1台并行机器,且至少一个阶段满足ms>1。独特之处在于每个工件需多次循环通过所有S个阶段(称为"圈数L"),形成典型的可重入加工路径。本文建立的五维MILP模型通过引入跨圈次机器分配约束,解决了现有模型对加工顺序约束的忽视问题。

Feature-Driven Double Deep Q-Network with Iterated Greedy特征驱动双深度Q网络与迭代贪婪算法

FD3QNIG算法如Fig.5所示,其核心创新包括:

1)FDNEH初始化策略:利用加工时间波动特征构建高质量初始解

2)AHDDR策略:通过动态调整破坏重建强度实现"探索-开发"平衡

3)首创将CED_MOLS应用于RHFSP:通过强制操作机制突破局部最优

4)DDQN_ASS机制:采用11维状态空间和7种搜索动作,通过融合局部与全局目标的奖励函数指导策略选择

Experimental Configuration and Evaluation Metrics实验配置与评估指标

实验采用TimeLimit=30×L×n×S(ms)的公平终止条件,在285个基准实例上验证算法性能。评估指标ARPI显示,FD3QNIG在求解质量和鲁棒性方面均显著优于对比算法。

Conclusions and Future Work结论与展望

本文提出的FD3QNIG算法通过特征驱动和自适应学习机制,有效解决了RHFSP的三大挑战:模型精度不足、搜索空间受限和策略选择僵化。未来工作将扩展算法在柔性制造系统中的普适性应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号