摘要
本发明提供一种模型训练方法、装置、存储介质及电子设备,该方法包括:调用N个初始大语言模型,分别生成初始训练文本数据集中的各个初始训练文本数据下的多轮对话数据;基于各个初始大语言模型的模型质量指示数据和各个初始训练文本数据下的多轮对话数据,构建各个初始训练文本数据下的原始偏序对话数据集,以确定各个初始训练文本数据下的校正偏序对话数据集;基于各个初始训练文本数据下的校正偏序对话数据集,分别对各个初始大语言模型进行模型训练,得到N个模型训练后的大语言模型;并基于N个模型训练后的大语言模型,确定N个目标大语言模型。本发明实施例可在减少模型训练成本的情况下,提高大语音模型的模型性能。
技术关键词
训练文本数据
大语言模型
多轮对话
校正
模型训练方法
答案
处理单元
模型训练装置
电子设备
计算机
处理器
指令
可读存储介质
程序
语音
存储器
系统为您推荐了相关专利信息
岩体结构面
数字图像识别技术
三维点云模型
光照
岩体边坡
代码补全方法
大语言模型
小规模
分类器模型
解码算法