大语言模型的训练方法及相关装置

AITNT
正文
推荐专利
大语言模型的训练方法及相关装置
申请号:CN202411523452
申请日期:2024-10-29
公开号:CN119493997A
公开日期:2025-02-21
类型:发明专利
摘要
本申请实施方式提供了一种大语言模型的训练方法及相关装置。大语言模型的训练方法包括:构建指令变体集;其中,所述指令变体集中包括多个提示指令组;所述提示指令组中包括具有相同目标文本的多个提示指令,不同提示指令组包括的目标文本不相同;每个提示指令组中的提示指令用于指示大语言模型将目标文本翻译成指定语言的翻译文本,并且,每个提示指令组中多个提示指令包括的提示指令词至少部分不相同;根据所述指令变体集训练大语言模型,以使得所述大语言模型对应提示指令组中的多个提示指令输出的翻译文本相同。可以一定程度上提升大语言模型的翻译文本的准确性。
技术关键词
大语言模型 文本 指令组 计算机程序产品 计算机设备 可读存储介质 训练装置 处理器 定义 存储器 身份 模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号