摘要
本发明提供一种基于DAG结构深度学习模型任务放置的流水线训练优化方法,包含:异构GPU集群中计算节点内的并行模式确定问题、不同计算节点间的并行方案组合问题、有向无环计算图的任务放置问题。本发明首先设计了一种异构集群节点内的GPU并行模式求解算法,以获得适用于节点内部的所有可用的并行模式。然后针对每个计算节点的并行方案选择问题,利用隔板法确定不同类型节点的并行方案。最后通过贪心思想,设计有向无环图结点任务放置算法,分配深度学习模型对应的有向无环图中的每一个结点,基于流水线混合并行总时间为执行时间最长的阶段的训练时间这一原理,最终得到整体训练时间最小的最优方案。本发明提高了效率,可靠性高。
技术关键词
训练优化方法
深度学习模型
流水线
贪心思想
异构集群节点
模式
求解算法
结点
有向无环图
划分算法
阶段
代表
变量
列表
数值
定义
系统为您推荐了相关专利信息
数据处理模型
建模方法
自然语言
建模平台
工业机器设备
早期识别方法
局部时空特征
多分支
编码器
滑动时间窗口
采集分析方法
声纹特征
环境噪声模型
麦克风阵列采集
表达式
分类方法
序列
磁共振
扩散加权图像
训练分类模型
消防预警系统
火灾风险评估
火灾特征
无线自组网通信协议
数据分析模块