大语言模型增强方法

AITNT
正文
推荐专利
大语言模型增强方法
申请号:CN202510900791
申请日期:2025-06-30
公开号:CN120806146A
公开日期:2025-10-17
类型:发明专利
摘要
本发明提供大语言模型增强方法。提供的方法包括:使用混合数据集对基础大语言模型进行微调,混合数据集包括来自生物医药数据集的生物医药数据和来自通用数据集的通用数据,生物医药数据包括生物医药问题以及针对生物医药问题的完成注释和偏好注释;使经微调的大语言模型基于生物医药数据集进行离线偏好学习,来对经微调的大语言模型进行增强;使经增强的大语言模型利用奖励模型基于混合问题集迭代地进行在线偏好学习,来对经增强的大语言模型进行进一步的增强,其中由经增强的大语言模型针对每个问题生成回答并由奖励模型对其评分,在当前迭代轮次针奖励模型对回答的评分的分布影响下一迭代轮次针对每个问题生成的回答的数量。
技术关键词
大语言模型 数据 机器可读介质 指令 计算机程序产品 在线 离线 存储器 基准 处理器 基础 种子 专业
系统为您推荐了相关专利信息
1
DC/DC电源管理方法、系统、电子设备、介质及电源
子系统 电源管理方法 历史功率数据 场景 电力
2
存算一体化芯片的动态功耗管理方法及相关设备
动态功耗管理方法 芯片 频谱分布图 管理策略 时钟门控技术
3
一种基于供热数据数字孪生体的管道监测方法
管道监测方法 数字孪生 管道内流动介质 压力 流速
4
一种毫米波水面流速测量雷达回波属性分类识别方法
属性分类识别方法 计算方法 门控循环单元 Softmax函数 回波
5
一种基于贝尔曼误差导向策略的离线强化学习方法
强化学习方法 离线 超参数 神经网络模型 网络学习方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号