一种自然语言处理模型的流水线并行训练方法、系统、终端及存储介质

AITNT
正文
推荐专利
一种自然语言处理模型的流水线并行训练方法、系统、终端及存储介质
申请号:CN202410856962
申请日期:2024-06-28
公开号:CN118503764A
公开日期:2024-08-16
类型:发明专利
摘要
本申请提供一种自然语言处理模型的流水线并行训练方法、系统、终端及存储介质,所述方法包括:将自然语言处理模型中的各单层模型划分为自注意力模块和前向神经网络模块,并进行模型预训练,得到各个模块的计算时间;将模型中的多个网络层划分为N份网络层,得到多个模型划分方案,并进行模拟计算,得到每个模型划分方案所对应的流水线并行方法的迭代时间;选取出最小的流水线并行方法的迭代时间所对应的模型划分方案,作为目标模型划分方案;将目标模型划分方案所划分出的N份网络层,分配至N个计算设备中,并通过N个计算设备采用流水线并行方式,对自然语言处理模型进行训练。本申请能够提高自然语言处理模型的流水线并行训练的效率。
技术关键词
自然语言 流水线 并行方法 并行训练方法 计算机执行指令 注意力 模块 训练数据处理 动态规划算法 模型预训练 可读存储介质 训练系统 模拟单元 单层 处理器 终端 基础
系统为您推荐了相关专利信息
1
客服知识库构建方法、装置和计算机可读存储介质
客服知识库 原型 模板引擎技术 知识点 条目
2
专家反馈驱动的政府采购智能辅助评标系统
评标系统 强化学习算法 机器学习方法 分析模块 命名实体识别技术
3
基于GRPO奖励函数的NL2SQL模型训练和存储方法及装置
存储方法 动态调整机制 自然语言 编辑 语句
4
流程优化方法、电子设备、存储介质及程序产品
计算机执行指令 日志 业务流程优化 可视化布局算法 数据
5
一种基于智能化分光光度的食品安全检测方法及系统
健康风险评估 食品安全检测方法 多变量统计分析 深度卷积神经网络 阈值分割算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号