一种针对大语言模型进行训练的方法、装置、设备、介质和产品

AITNT
正文
推荐专利
一种针对大语言模型进行训练的方法、装置、设备、介质和产品
申请号:CN202411838160
申请日期:2024-12-13
公开号:CN119578491A
公开日期:2025-03-07
类型:发明专利
摘要
本说明书实施例提供针对大语言模型进行训练的方法及装置。其中所述方法包括:获取基于业务数据生成的多条样本数据;针对多条样本数据进行拼接处理,得到若干条拼接样本数据;若拼接样本数据的数据长度小于标准数据长度,则对拼接样本数据进行填充处理,填充后拼接样本数据的数据长度等于标准数据长度,将填充后拼接样本数据输入至大语言模型对大语言模型进行训练,得到训练后的大语言模型。该方案,通过将由多条样本数据构成的拼接样本数据的数据长度填充至标准数据长度,相对于分别将各条样本数据的数据长度均填充至标准数据长度,可以减少样本数据的数据填充量,进而可以提升针对大语言模型的训练效率。
技术关键词
大语言模型 样本 数据同步方法 指令 处理器 存储计算机程序 多轮对话 计算机程序产品 拼接模块 输入模块 可读存储介质 存储器 参数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号