一种多语言大语言模型训练方法、多语言问答方法及装置

正文

推荐专利

申请号：CN202411966033

申请日期：2024-12-30

公开号：CN120087494A

公开日期：2025-06-03

类型：发明专利

摘要

本申请提供了一种多语言大语言模型训练方法、多语言问答方法及装置，通过获取多种不同语言类型的问答组合样本以及训练任务指令，利用不同的问答组合样本中的问题样本、答案样本，结合训练任务指令指示的多语言大语言模型预期达到的训练效果，对多语言大语言模型进行训练，直至该多语言大语言模型输出的结果满足训练任务指令要求。如此，在小语种训练样本资源匮乏的情况下，借助训练任务指令将非英文的样本数据转换为英文样本数据后，以英文样本数据作为训练中间样本进行模型训练，以提高多语言大语言模型在跨多种语言上的理解能力，有利于将训练得到的目标多语言大语言模型部署至资源较小的硬件设备中，扩展了多语言大语言模型的应用范围。

技术关键词

大语言模型多语言答案训练样本数据指令问答方法文本模型训练模块计算机训练装置电子设备硬件设备处理器输出模块参数可读存储介质程序资源

系统为您推荐了相关专利信息

一种基于轴流风机多源信号融合故障监测方法及系统

故障监测方法信号特征多源定位算法时间差计算机可执行指令

一种用于软件操作类技能考核的系统及其答题评分方法

答题评分方法答案答题数据学生标签

视频生成模型的训练方法、视频生成方法

视频生成模型标记降噪模块样本视频帧

一种图像尺寸比对方法、装置、设备及存储介质

比对方法邻近算法图像特征点尺寸数值

基于多指标融合的DKA合并AP风险预测模型、介质和设备

风险预测模型多指标脂肪酶数据资料

一种多语言大语言模型训练方法、多语言问答方法及装置

站点导航

APP 下载