摘要
本申请公开了用于利用零气泡流水线并行化来训练神经网络模型的方法和设备。各种实施例涉及利用零气泡流水线并行化来训练神经网络模型的计算机实施的方法,该计算机实施的方法包括:通过神经网络模型执行多个正向传播,其中多个正向传播中的每个正向传播将对应输入x变换为对应输出y;通过神经网络模型执行多个反向传播,其中多个反向传播分为多个梯度计算传播B和多个参数计算传播W;针对对应输入x和对应输出y执行多个梯度计算传播B;以及确定流水线气泡以及在流水线气泡期间执行多个参数计算传播W。
技术关键词
训练神经网络模型
流水线
启发式算法
气泡
前馈神经网络
参数
计算机程序产品
内存
可读存储介质
计算机设备
处理器
指令
存储器
系统为您推荐了相关专利信息
物体检测方法
柱面
高层语义特征
生成多尺度
非线性映射关系
医疗文本分类方法
bert模型
模版
多头注意力机制
关系
图像超分辨率方法
电商
编码器模块
超分辨率模型
计算机程序指令