
-
生物通官微
陪你抓住生命科技
跳动的脉搏
异构超算集群中基于图卷积网络与近端策略优化的可学习动态调度算法研究
【字体: 大 中 小 】 时间:2025年08月05日 来源:Future Generation Computer Systems 6.2
编辑推荐:
本文创新性地提出异构层次化细粒度可学习动态调度算法(HeHiFLDSA),通过整合图卷积网络(GCN)和近端策略优化(PPO),解决了异构超算集群中工作流完成时间长、资源利用率低的难题。算法采用层次化任务嵌入和资源继承机制,引入动态任务规模依赖参数,在仿真平台上实现资源利用率提升5.2%、工作流完成时间缩短50%的突破性表现。
Highlight
本研究提出异构层次化细粒度可学习动态调度算法(HeHiFLDSA),通过图卷积网络(GCN)捕捉工作流DAG的关键路径依赖关系,结合改进的近端策略优化(PPO)实现动态资源编排。创新性地设计了资源继承机制减少任务间通信开销,并引入任务规模敏感的动态参数稳定训练过程。
Scientific workflows
在异构超算集群中,科学工作流Gi(V,D)以有向无环图(DAG)形式呈现,其中V=(v1i,v2i,...,vni)表示任务节点集,D=(dj,k|vji,vki∈V)定义任务依赖关系。前驱任务完成约束机制确保计算拓扑的正确性。
Improvement of the PPO’s advantage function
改进PPO算法的优势函数LCLIP(πθ)=Eτ~πθold[∑t=0Tmin(ratiot(θ)A?t,clip(ratiot(θ),1-?,1+?)A?t)],其中ratiot(θ)=πθ(at|st)/πθold(at|st)。通过动态调整裁剪阈值?,有效缓解大规模任务流场景下的奖励方差问题。
Simulation environment
基于OpenAI Gym构建的仿真平台包含:1)调度决策生成器;2)资源分配模拟器;3)标准化交互接口。平台生成1000个真实场景的DAG工作流,模拟异构多核计算节点(含CPU/GPU),通过泊松过程模拟任务到达的随机性。
Conclusion
本方法通过层次化调度决策减少状态信息处理开销,实验验证其在资源继承和任务内细粒度并行方面的优势,为超算集群的"绿色计算"提供新思路。
生物通微信公众号
知名企业招聘