语言模型的优化、处理方法、设备、介质和程序产品

正文

推荐专利

申请号：CN202411613443

申请日期：2024-11-12

公开号：CN119129673B

公开日期：2025-04-08

类型：发明专利

摘要

本申请实施例提供了一种语言模型的优化、处理方法、设备、介质和程序产品。所述方法包括：获取语言模型对应调用工具的路径数据，基于所述路径数据构建偏好数据集，所述路径数据包括成功路径和失败路径；基于所述偏好数据集获取输入数据，将所述输入数据输入到所述语言模型中，获取对应的输出结果；基于所述输出结果和奖励模型确定损失函数；基于所述损失函数调整所述语言模型的参数，得到优化的语言模型。能够通过引入失败决策信息，丰富偏好数据集，提高了数据利用率，据此优化语言模型，提高语言模型的准确性。

技术关键词

计算机执行指令数据强化学习算法节点服务需求信息计算机可执行指令分支信息查询工具客服页面可读存储介质资源计算机程序产品电子设备处理器通信参数存储器

系统为您推荐了相关专利信息

电网响应资源投入值预测模型的训练方法、装置和设备

资源样本生成对抗网络矩阵场景

训练用来控制机器人以操纵对象的机器学习模型的方法

接触点末端执行器元素对象球形

针对能化产品三级目录的定位访问方法

节点目录平衡二叉树搜索算法技术标识符

一种基于自适应的钻机绞车的故障诊断方法与装置

钻机绞车故障诊断模型故障诊断方法一维卷积神经网络信号

一种基于强化学习的金融风控决策策略优化系统和方法

决策策略优化方法金融深度强化学习方法风险

语言模型的优化、处理方法、设备、介质和程序产品

站点导航

APP 下载