模型训练方法、电子设备、存储介质及程序产品

AITNT
正文
推荐专利
模型训练方法、电子设备、存储介质及程序产品
申请号:CN202411900790
申请日期:2024-12-20
公开号:CN119830988A
公开日期:2025-04-15
类型:发明专利
摘要
本申请涉及计算机技术领域,公开了一种模型训练方法、电子设备、存储介质及程序产品。该方法中,用于训练第一大语言模型的第一训练样本包括用户指令、用户指令对应的至少一个工具名称,每个工具名称包括至少一个参考标记。将用户指令输入至第一大语言模型之后,基于该模型输出的预测结果确定各参考标记的第一损失。根据参考标记的标记类别的不同,为各参考标记设置不同的损失权重,然后对各参考标记的第一损失进行加权计算,得到目标损失。基于目标损失训练第一大语言模型,得到第二大语言模型。该方法中,不同标记类别的参考标记对应不同的损失权重,可以提升第二大语言模型在预测具有较大损失权重的标记类别的参考标记时的准确度。
技术关键词
标记 大语言模型 模型训练方法 指令 电子设备上执行 可读存储介质 计算机程序产品 存储器 处理器 参数 策略 数值 算法
系统为您推荐了相关专利信息
1
一种全局模型的并行训练方法、装置、设备、介质和产品
并行训练方法 模型更新 参数 精度 节点
2
一种电机故障片段筛选方法、设备及存储介质
电机运行数据 筛选方法 电机故障诊断技术 字段 高斯混合模型
3
碳酸盐岩储层的孔隙度三维建模方法、系统、介质、设备
碳酸盐岩储层 三维建模方法 三维模型 三维构造建模 地震勘探数据
4
一种基于图数据库的函数链自动生成方法、设备及介质
自动生成方法 查询意图 语义向量 自然语言 节点
5
一种基于视频融合的场站管理方法及系统
全景视频数据 三维场景模型 远程控制终端 异常信息 管理方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号