异构超算集群中基于图卷积网络与近端策略优化的可学习动态调度算法研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年08月05日 来源：Future Generation Computer Systems 6.2

编辑推荐：

　　本文创新性地提出异构层次化细粒度可学习动态调度算法（HeHiFLDSA），通过整合图卷积网络（GCN）和近端策略优化（PPO），解决了异构超算集群中工作流完成时间长、资源利用率低的难题。算法采用层次化任务嵌入和资源继承机制，引入动态任务规模依赖参数，在仿真平台上实现资源利用率提升5.2%、工作流完成时间缩短50%的突破性表现。

Highlight

本研究提出异构层次化细粒度可学习动态调度算法（HeHiFLDSA），通过图卷积网络（GCN）捕捉工作流DAG的关键路径依赖关系，结合改进的近端策略优化（PPO）实现动态资源编排。创新性地设计了资源继承机制减少任务间通信开销，并引入任务规模敏感的动态参数稳定训练过程。

Scientific workflows

在异构超算集群中，科学工作流Gⁱ(V,D)以有向无环图（DAG）形式呈现，其中V=(v₁ⁱ,v₂ⁱ,...,v_nⁱ)表示任务节点集，D=(d_j,k|v_jⁱ,v_kⁱ∈V)定义任务依赖关系。前驱任务完成约束机制确保计算拓扑的正确性。

Improvement of the PPO’s advantage function

改进PPO算法的优势函数L^CLIP(π_θ)=E_{τ～π_{θ_old}}[∑_t=0^Tmin(ratio_t(θ)A?_t,clip(ratio_t(θ),1-?,1+?)A?_t)]，其中ratio_t(θ)=π_θ(a_t|s_t)/π_{θ_old}(a_t|s_t)。通过动态调整裁剪阈值?，有效缓解大规模任务流场景下的奖励方差问题。

Simulation environment

基于OpenAI Gym构建的仿真平台包含：1）调度决策生成器；2）资源分配模拟器；3）标准化交互接口。平台生成1000个真实场景的DAG工作流，模拟异构多核计算节点（含CPU/GPU），通过泊松过程模拟任务到达的随机性。

Conclusion

本方法通过层次化调度决策减少状态信息处理开销，实验验证其在资源继承和任务内细粒度并行方面的优势，为超算集群的"绿色计算"提供新思路。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号