摘要
本申请提供了一种多语言大语言模型训练方法、多语言问答方法及装置,通过获取多种不同语言类型的问答组合样本以及训练任务指令,利用不同的问答组合样本中的问题样本、答案样本,结合训练任务指令指示的多语言大语言模型预期达到的训练效果,对多语言大语言模型进行训练,直至该多语言大语言模型输出的结果满足训练任务指令要求。如此,在小语种训练样本资源匮乏的情况下,借助训练任务指令将非英文的样本数据转换为英文样本数据后,以英文样本数据作为训练中间样本进行模型训练,以提高多语言大语言模型在跨多种语言上的理解能力,有利于将训练得到的目标多语言大语言模型部署至资源较小的硬件设备中,扩展了多语言大语言模型的应用范围。
技术关键词
大语言模型
多语言
答案
训练样本数据
指令
问答方法
文本
模型训练模块
计算机
训练装置
电子设备
硬件设备
处理器
输出模块
参数
可读存储介质
程序
资源
系统为您推荐了相关专利信息
故障监测方法
信号特征
多源定位算法
时间差
计算机可执行指令