异构超算集群中基于图卷积网络与近端策略优化的可学习动态调度算法研究

【字体: 时间:2025年08月05日 来源:Future Generation Computer Systems 6.2

编辑推荐:

  本文创新性地提出异构层次化细粒度可学习动态调度算法(HeHiFLDSA),通过整合图卷积网络(GCN)和近端策略优化(PPO),解决了异构超算集群中工作流完成时间长、资源利用率低的难题。算法采用层次化任务嵌入和资源继承机制,引入动态任务规模依赖参数,在仿真平台上实现资源利用率提升5.2%、工作流完成时间缩短50%的突破性表现。

  

Highlight

本研究提出异构层次化细粒度可学习动态调度算法(HeHiFLDSA),通过图卷积网络(GCN)捕捉工作流DAG的关键路径依赖关系,结合改进的近端策略优化(PPO)实现动态资源编排。创新性地设计了资源继承机制减少任务间通信开销,并引入任务规模敏感的动态参数稳定训练过程。

Scientific workflows

在异构超算集群中,科学工作流Gi(V,D)以有向无环图(DAG)形式呈现,其中V=(v1i,v2i,...,vni)表示任务节点集,D=(dj,k|vji,vki∈V)定义任务依赖关系。前驱任务完成约束机制确保计算拓扑的正确性。

Improvement of the PPO’s advantage function

改进PPO算法的优势函数LCLIPθ)=Eτ~πθold[∑t=0Tmin(ratiot(θ)A?t,clip(ratiot(θ),1-?,1+?)A?t)],其中ratiot(θ)=πθ(at|st)/πθold(at|st)。通过动态调整裁剪阈值?,有效缓解大规模任务流场景下的奖励方差问题。

Simulation environment

基于OpenAI Gym构建的仿真平台包含:1)调度决策生成器;2)资源分配模拟器;3)标准化交互接口。平台生成1000个真实场景的DAG工作流,模拟异构多核计算节点(含CPU/GPU),通过泊松过程模拟任务到达的随机性。

Conclusion

本方法通过层次化调度决策减少状态信息处理开销,实验验证其在资源继承和任务内细粒度并行方面的优势,为超算集群的"绿色计算"提供新思路。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号