一种针对大语言模型进行训练的方法、装置、设备、介质和产品

正文

推荐专利

申请号：CN202411838160

申请日期：2024-12-13

公开号：CN119578491A

公开日期：2025-03-07

类型：发明专利

摘要

本说明书实施例提供针对大语言模型进行训练的方法及装置。其中所述方法包括：获取基于业务数据生成的多条样本数据；针对多条样本数据进行拼接处理，得到若干条拼接样本数据；若拼接样本数据的数据长度小于标准数据长度，则对拼接样本数据进行填充处理，填充后拼接样本数据的数据长度等于标准数据长度，将填充后拼接样本数据输入至大语言模型对大语言模型进行训练，得到训练后的大语言模型。该方案，通过将由多条样本数据构成的拼接样本数据的数据长度填充至标准数据长度，相对于分别将各条样本数据的数据长度均填充至标准数据长度，可以减少样本数据的数据填充量，进而可以提升针对大语言模型的训练效率。

技术关键词

大语言模型样本数据同步方法指令处理器存储计算机程序多轮对话计算机程序产品拼接模块输入模块可读存储介质存储器参数

一种针对大语言模型进行训练的方法、装置、设备、介质和产品

站点导航

APP 下载