摘要
本申请涉及计算机技术领域,公开了一种模型训练方法、电子设备、存储介质及程序产品。该方法中,用于训练第一大语言模型的第一训练样本包括用户指令、用户指令对应的至少一个工具名称,每个工具名称包括至少一个参考标记。将用户指令输入至第一大语言模型之后,基于该模型输出的预测结果确定各参考标记的第一损失。根据参考标记的标记类别的不同,为各参考标记设置不同的损失权重,然后对各参考标记的第一损失进行加权计算,得到目标损失。基于目标损失训练第一大语言模型,得到第二大语言模型。该方法中,不同标记类别的参考标记对应不同的损失权重,可以提升第二大语言模型在预测具有较大损失权重的标记类别的参考标记时的准确度。
技术关键词
标记
大语言模型
模型训练方法
指令
电子设备上执行
可读存储介质
计算机程序产品
存储器
处理器
参数
策略
数值
算法
系统为您推荐了相关专利信息
电机运行数据
筛选方法
电机故障诊断技术
字段
高斯混合模型
碳酸盐岩储层
三维建模方法
三维模型
三维构造建模
地震勘探数据
全景视频数据
三维场景模型
远程控制终端
异常信息
管理方法