回复生成模型训练方法及相关装置

正文

推荐专利

回复生成模型训练方法及相关装置

申请号：CN202510449102

申请日期：2025-04-10

公开号：CN120597975A

公开日期：2025-09-05

类型：发明专利

摘要

本申请公开了一种回复生成模型训练方法及相关装置，该回复生成模型训练方法包括：获取当前轮的对话训练集，其中，当前轮的对话训练集包括至少一个第一对话，第一对话包括第一查询和对应的第一回复，至少一个第一对话包括当前轮对应的第一对话，当前轮对应的第一对话中的第一回复是由当前轮的上一轮得到的强化学习大模型基于对应的第一查询生成；利用当前轮的对话训练集对预训练大模型进行监督微调，得到当前轮的监督微调大模型；利用当前轮的监督微调大模型进行强化学习，得到当前轮的强化学习大模型；其中，最终轮得到的强化学习大模型作为回复生成模型。上述方案，能够提升训练效果和训练效率。

技术关键词

生成模型训练方法训练集回复生成方法模型训练装置生成装置处理器模块可读存储介质程序指令存储器电子设备计算机

系统为您推荐了相关专利信息

基于用户行为画像的智能广告投放系统及方法

智能广告投放系统图片识别技术模块构建用户画像智能广告投放方法

核电循环泵用齿轮箱组合轴承状态识别方法及系统

级联残差神经网络齿轮箱组合频域信息融合状态识别方法残差模块

一种电流互感器故障诊断方法及其系统

故障诊断模型制作电流互感器注意力机制漂移故障故障诊断系统

一种用于智能化抽取船舶碰撞事故风险影响因素传播路径的方法

船舶风险实体报告数据

心音信号分类方法及装置

心音信号分类方法特征提取算法心动周期机器学习模型训练特征选择

回复生成模型训练方法及相关装置

站点导航

APP 下载