模型训练方法、电子设备、存储介质及程序产品

正文

推荐专利

申请号：CN202411900790

申请日期：2024-12-20

公开号：CN119830988A

公开日期：2025-04-15

类型：发明专利

摘要

本申请涉及计算机技术领域，公开了一种模型训练方法、电子设备、存储介质及程序产品。该方法中，用于训练第一大语言模型的第一训练样本包括用户指令、用户指令对应的至少一个工具名称，每个工具名称包括至少一个参考标记。将用户指令输入至第一大语言模型之后，基于该模型输出的预测结果确定各参考标记的第一损失。根据参考标记的标记类别的不同，为各参考标记设置不同的损失权重，然后对各参考标记的第一损失进行加权计算，得到目标损失。基于目标损失训练第一大语言模型，得到第二大语言模型。该方法中，不同标记类别的参考标记对应不同的损失权重，可以提升第二大语言模型在预测具有较大损失权重的标记类别的参考标记时的准确度。

技术关键词

标记大语言模型模型训练方法指令电子设备上执行可读存储介质计算机程序产品存储器处理器参数策略数值算法

系统为您推荐了相关专利信息

一种全局模型的并行训练方法、装置、设备、介质和产品

并行训练方法模型更新参数精度节点

一种电机故障片段筛选方法、设备及存储介质

电机运行数据筛选方法电机故障诊断技术字段高斯混合模型

碳酸盐岩储层的孔隙度三维建模方法、系统、介质、设备

碳酸盐岩储层三维建模方法三维模型三维构造建模地震勘探数据

一种基于图数据库的函数链自动生成方法、设备及介质

自动生成方法查询意图语义向量自然语言节点

一种基于视频融合的场站管理方法及系统

全景视频数据三维场景模型远程控制终端异常信息管理方法

模型训练方法、电子设备、存储介质及程序产品

站点导航

APP 下载