摘要
本说明书实施例提供一种训练大语言模型的方法和装置。第一大语言模型的生成数据包括,针对输入问题的答案或者针对输入问题的查询语句。方法包括:获取第一训练样本和第二训练样本,所述第一训练样本中的样本标签包括针对该第一训练样本中的输入问题的答案,所述第二训练样本中的样本标签包括针对该第二训练样本中的输入问题的查询语句;基于所述第一训练样本和所述第二训练样本,对所述第一大语言模型进行监督训练。能够保证稳定训练。
技术关键词
大语言模型
语句
答案
样本
文本
标签
指令
标记
计算机
数据
可读存储介质
存储器
策略
处理器
参数
序列
系统为您推荐了相关专利信息
乳腺癌保乳
勾画系统
深度学习模型
图像处理单元
混合损失函数
文本生成图像方法
注意力
对象
图像生成单元
可读存储介质
三维城市模型
多层感知器网络
大语言模型
噪声预测模型
噪声优化方法
多层感知网络
图像
视觉特征
显著性检测模型
样本
智慧城市系统
机器可读数据
多模态数据采集
朴素贝叶斯模型
方差贡献率