一种自然语言处理模型的流水线并行训练方法、系统、终端及存储介质

正文

推荐专利

申请号：CN202410856962

申请日期：2024-06-28

公开号：CN118503764A

公开日期：2024-08-16

类型：发明专利

摘要

本申请提供一种自然语言处理模型的流水线并行训练方法、系统、终端及存储介质，所述方法包括：将自然语言处理模型中的各单层模型划分为自注意力模块和前向神经网络模块，并进行模型预训练，得到各个模块的计算时间；将模型中的多个网络层划分为N份网络层，得到多个模型划分方案，并进行模拟计算，得到每个模型划分方案所对应的流水线并行方法的迭代时间；选取出最小的流水线并行方法的迭代时间所对应的模型划分方案，作为目标模型划分方案；将目标模型划分方案所划分出的N份网络层，分配至N个计算设备中，并通过N个计算设备采用流水线并行方式，对自然语言处理模型进行训练。本申请能够提高自然语言处理模型的流水线并行训练的效率。

技术关键词

自然语言流水线并行方法并行训练方法计算机执行指令注意力模块训练数据处理动态规划算法模型预训练可读存储介质训练系统模拟单元单层处理器终端基础

系统为您推荐了相关专利信息

客服知识库构建方法、装置和计算机可读存储介质

客服知识库原型模板引擎技术知识点条目

专家反馈驱动的政府采购智能辅助评标系统

评标系统强化学习算法机器学习方法分析模块命名实体识别技术

基于GRPO奖励函数的NL2SQL模型训练和存储方法及装置

存储方法动态调整机制自然语言编辑语句

流程优化方法、电子设备、存储介质及程序产品

计算机执行指令日志业务流程优化可视化布局算法数据

一种基于智能化分光光度的食品安全检测方法及系统

健康风险评估食品安全检测方法多变量统计分析深度卷积神经网络阈值分割算法

一种自然语言处理模型的流水线并行训练方法、系统、终端及存储介质

站点导航

APP 下载