摘要
本申请属于人工智能技术领域,具体涉及一种模型训练方法、模型训练装置、计算机可读介质、电子设备以及计算机程序产品。该方法包括:获取多个训练样本,所述训练样本包括由多个词元组成的词元序列;将多个所述训练样本组合得到具有指定样本长度的拼接样本,所述样本长度是所述拼接样本中包含的词元数量;根据并行化运行的多个训练进程,将所述拼接样本拆分为多个样本片段;根据所述样本片段与所述训练进程的对应关系,确定所述训练进程的指令序列,所述指令序列包括用于对所述样本片段执行的操作指令;将所述指令序列发送至用于运行所述训练进程的计算设备。本申请可以提高模型训练过程的资源利用效率。
技术关键词
模型训练方法
注意力
样本
进程
指令
序列
模型训练装置
关系
计算机程序产品
设备组
矩阵
电子设备
处理器
人工智能技术
组合模块
介质
模板
数据