摘要
本申请实施例提供了一种语言模型的优化、处理方法、设备、介质和程序产品。所述方法包括:获取语言模型对应调用工具的路径数据,基于所述路径数据构建偏好数据集,所述路径数据包括成功路径和失败路径;基于所述偏好数据集获取输入数据,将所述输入数据输入到所述语言模型中,获取对应的输出结果;基于所述输出结果和奖励模型确定损失函数;基于所述损失函数调整所述语言模型的参数,得到优化的语言模型。能够通过引入失败决策信息,丰富偏好数据集,提高了数据利用率,据此优化语言模型,提高语言模型的准确性。
技术关键词
计算机执行指令
数据
强化学习算法
节点
服务需求信息
计算机可执行指令
分支
信息查询工具
客服
页面
可读存储介质
资源
计算机程序产品
电子设备
处理器通信
参数
存储器
系统为您推荐了相关专利信息
钻机绞车
故障诊断模型
故障诊断方法
一维卷积神经网络
信号