摘要
本发明提供一种考虑多资源交错的深度学习作业调度方法,包括以下步骤:将深度学习作业划分为数据加载、数据预处理、前向/反向传播、梯度同步四个阶段,分别绑定至存储IO、CPU、GPU、网络IO四类资源需求;根据作业各阶段的资源需求向量与节点资源容量向量,建立作业到节点的映射约束条件;基于阶段的划分和约束条件,通过DPGB算法确定作业到节点的映射方案,并在同一节点内对作业进行多资源交错分组,生成最小化全局完工时间的调度方案;所述DPGB算法包括离散粒子群优化与遗传算法的混合策略DDPSO‑GA和多轮Blossom算法;根据分组方案,在节点上按阶段动态分配资源,实现多资源并行利用。
技术关键词
资源
深度学习作业
节点
粒子
阶段
遗传算法
作业提交
元素
动态
处理器
线性
分层
存储器
数据
电子设备
网络
集群
参数
系统为您推荐了相关专利信息
心电图诊断方法
单导联心电信号
多导联心电信号
患者
多层感知器
图片生成方法
文本编码器
文本生成模型
身份
图像嵌入
分层强化学习
路径规划方法
终点
人工神经网络
强化学习方法
医疗健康管理系统
映射机构
心血管医生
摄像器件
云端监控