摘要
本申请提供一种自然语言处理模型的流水线并行训练方法、系统、终端及存储介质,所述方法包括:将自然语言处理模型中的各单层模型划分为自注意力模块和前向神经网络模块,并进行模型预训练,得到各个模块的计算时间;将模型中的多个网络层划分为N份网络层,得到多个模型划分方案,并进行模拟计算,得到每个模型划分方案所对应的流水线并行方法的迭代时间;选取出最小的流水线并行方法的迭代时间所对应的模型划分方案,作为目标模型划分方案;将目标模型划分方案所划分出的N份网络层,分配至N个计算设备中,并通过N个计算设备采用流水线并行方式,对自然语言处理模型进行训练。本申请能够提高自然语言处理模型的流水线并行训练的效率。
技术关键词
自然语言
流水线
并行方法
并行训练方法
计算机执行指令
注意力
模块
训练数据处理
动态规划算法
模型预训练
可读存储介质
训练系统
模拟单元
单层
处理器
终端
基础
系统为您推荐了相关专利信息
评标系统
强化学习算法
机器学习方法
分析模块
命名实体识别技术
计算机执行指令
日志
业务流程优化
可视化布局算法
数据
健康风险评估
食品安全检测方法
多变量统计分析
深度卷积神经网络
阈值分割算法