语言模型的优化、处理方法、设备、介质和程序产品

AITNT
正文
推荐专利
语言模型的优化、处理方法、设备、介质和程序产品
申请号:CN202411613443
申请日期:2024-11-12
公开号:CN119129673B
公开日期:2025-04-08
类型:发明专利
摘要
本申请实施例提供了一种语言模型的优化、处理方法、设备、介质和程序产品。所述方法包括:获取语言模型对应调用工具的路径数据,基于所述路径数据构建偏好数据集,所述路径数据包括成功路径和失败路径;基于所述偏好数据集获取输入数据,将所述输入数据输入到所述语言模型中,获取对应的输出结果;基于所述输出结果和奖励模型确定损失函数;基于所述损失函数调整所述语言模型的参数,得到优化的语言模型。能够通过引入失败决策信息,丰富偏好数据集,提高了数据利用率,据此优化语言模型,提高语言模型的准确性。
技术关键词
计算机执行指令 数据 强化学习算法 节点 服务需求信息 计算机可执行指令 分支 信息查询工具 客服 页面 可读存储介质 资源 计算机程序产品 电子设备 处理器通信 参数 存储器
系统为您推荐了相关专利信息
1
电网响应资源投入值预测模型的训练方法、装置和设备
资源 样本 生成对抗网络 矩阵 场景
2
训练用来控制机器人以操纵对象的机器学习模型的方法
接触点 末端执行器 元素 对象 球形
3
针对能化产品三级目录的定位访问方法
节点 目录 平衡二叉树 搜索算法技术 标识符
4
一种基于自适应的钻机绞车的故障诊断方法与装置
钻机绞车 故障诊断模型 故障诊断方法 一维卷积神经网络 信号
5
一种基于强化学习的金融风控决策策略优化系统和方法
决策 策略优化方法 金融 深度强化学习方法 风险
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号