摘要
本公开提供了用于分布式深度学习训练的混合流水线调度方法及装置。本公开涉及人工智能技术领域,尤其涉及分布式训练、机器学习和深度学习等技术领域。具体方案为:将训练数据划分为N个连续的数据序列,每个数据序列包含K个微批次;对前N‑1个数据序列采用前向‑反向交织调度策略执行计算;对第N个数据序列采用交织式1F1B调度策略执行计算;其中,对第N个数据序列采用交织式1F1B调度策略执行计算,包括:对第N个数据序列中的任一微批次,在其前向计算完成后立即触发反向计算;对任一微批次,在其反向计算完成后立即释放该微批次前向计算生成的激活值所占用的显存。
技术关键词
分布式深度学习
混合流水线
序列
数据
策略
张量处理器
分布式训练
深度学习模型
图形处理器
人工智能技术
计算机程序产品
执行设备
调度装置
子模块
处理器通信
指令
阶段
系统为您推荐了相关专利信息
水电机组
故障诊断方法
故障案例库
量子态
故障诊断系统
终点
计算机可执行指令
学习器
注意力机制
值预测方法
分类驾驶员
紧急制动方法
新能源汽车
制动减速度
轮廓系数
交通安全评价方法
车辆轨迹数据
车辆模型
交通冲突模型
非易失性存储介质