大语言模型增强方法

正文

推荐专利

大语言模型增强方法

申请号：CN202510900791

申请日期：2025-06-30

公开号：CN120806146A

公开日期：2025-10-17

类型：发明专利

摘要

本发明提供大语言模型增强方法。提供的方法包括：使用混合数据集对基础大语言模型进行微调，混合数据集包括来自生物医药数据集的生物医药数据和来自通用数据集的通用数据，生物医药数据包括生物医药问题以及针对生物医药问题的完成注释和偏好注释；使经微调的大语言模型基于生物医药数据集进行离线偏好学习，来对经微调的大语言模型进行增强；使经增强的大语言模型利用奖励模型基于混合问题集迭代地进行在线偏好学习，来对经增强的大语言模型进行进一步的增强，其中由经增强的大语言模型针对每个问题生成回答并由奖励模型对其评分，在当前迭代轮次针奖励模型对回答的评分的分布影响下一迭代轮次针对每个问题生成的回答的数量。

技术关键词

大语言模型数据机器可读介质指令计算机程序产品在线离线存储器基准处理器基础种子专业

系统为您推荐了相关专利信息

DC/DC电源管理方法、系统、电子设备、介质及电源

子系统电源管理方法历史功率数据场景电力

存算一体化芯片的动态功耗管理方法及相关设备

动态功耗管理方法芯片频谱分布图管理策略时钟门控技术

一种基于供热数据数字孪生体的管道监测方法

管道监测方法数字孪生管道内流动介质压力流速

一种毫米波水面流速测量雷达回波属性分类识别方法

属性分类识别方法计算方法门控循环单元 Softmax函数回波

一种基于贝尔曼误差导向策略的离线强化学习方法

强化学习方法离线超参数神经网络模型网络学习方法

大语言模型增强方法

站点导航

APP 下载