摘要
本公开提供了一种HPC工作流的自动资源分配和分区。一种方法包括接收包括多个内核的用户提交的工作流。该方法进一步包括用至少一个剖析标签填充用户提交的工作流中的至少一个内核,并在计算节点上执行该用户提交的工作流。该方法进一步包括根据至少一个剖析标签在工作流的执行期间从工作流中接收至少一个指标,并根据该至少一个指标训练强化学习代理,其中强化学习代理根据该至少一个指标确定针对特定类型内核的建议动作。该方法进一步包括在用户提交的工作流继续执行时,利用建议的动作做出用于执行与多个内核中的未执行内核相关联的任务的调度决策,其中该调度决策包括用于执行该任务的计算资源分配。
技术关键词
强化学习代理
工作流模型
内核
指标
工作流执行
资源分配
离线
决策
图形处理单元
调度器
标签
节点
计算机
处理器
硬件设备
介质
加速器
指令
系统为您推荐了相关专利信息
协同管理系统
自动编码
联盟链系统
指标
编码管理技术
尾矿库
应急响应措施
预警方法
汇水面积
预警系统