大语言模型的训练方法及相关装置

正文

推荐专利

大语言模型的训练方法及相关装置

申请号：CN202411523452

申请日期：2024-10-29

公开号：CN119493997A

公开日期：2025-02-21

类型：发明专利

摘要

本申请实施方式提供了一种大语言模型的训练方法及相关装置。大语言模型的训练方法包括：构建指令变体集；其中，所述指令变体集中包括多个提示指令组；所述提示指令组中包括具有相同目标文本的多个提示指令，不同提示指令组包括的目标文本不相同；每个提示指令组中的提示指令用于指示大语言模型将目标文本翻译成指定语言的翻译文本，并且，每个提示指令组中多个提示指令包括的提示指令词至少部分不相同；根据所述指令变体集训练大语言模型，以使得所述大语言模型对应提示指令组中的多个提示指令输出的翻译文本相同。可以一定程度上提升大语言模型的翻译文本的准确性。

技术关键词

大语言模型文本指令组计算机程序产品计算机设备可读存储介质训练装置处理器定义存储器身份模块

大语言模型的训练方法及相关装置

站点导航

APP 下载