摘要
本申请实施方式提供了一种大语言模型的训练方法及相关装置。大语言模型的训练方法包括:构建指令变体集;其中,所述指令变体集中包括多个提示指令组;所述提示指令组中包括具有相同目标文本的多个提示指令,不同提示指令组包括的目标文本不相同;每个提示指令组中的提示指令用于指示大语言模型将目标文本翻译成指定语言的翻译文本,并且,每个提示指令组中多个提示指令包括的提示指令词至少部分不相同;根据所述指令变体集训练大语言模型,以使得所述大语言模型对应提示指令组中的多个提示指令输出的翻译文本相同。可以一定程度上提升大语言模型的翻译文本的准确性。
技术关键词
大语言模型
文本
指令组
计算机程序产品
计算机设备
可读存储介质
训练装置
处理器
定义
存储器
身份
模块