问答模型训练方法、文本处理方法及奖励模型训练方法

正文

推荐专利

申请号：CN202410779372

申请日期：2024-06-17

公开号：CN118350463B

公开日期：2024-09-27

类型：发明专利

摘要

本说明书实施例提供问答模型训练方法、文本处理方法及奖励模型训练方法，其中所述问答模型训练方法包括：在问答样本对中提取样本问题，并确定所述样本问题对应的思维链数据；利用所述思维链数据将所述样本问题更新为目标样本问题，并将所述目标样本问题输入至初始问答模型进行处理，获得预测答案；利用所述初始问答模型关联的奖励模型根据所述问答样本对中的样本答案，对所述预测答案进行打分，获得优化分值；基于所述优化分值对所述初始问答模型进行调参，直至获得满足训练停止条件的目标问答模型。

技术关键词

问答模型训练方法样本答案序列计算机可执行指令文本处理方法文本处理装置客户端模型训练装置模块数据处理器计算机程序产品思路可读存储介质

系统为您推荐了相关专利信息

一种汽车零部件存储用数字化仓储系统

数字化仓储系统汽车零部件数据存储模块数据分析模块数据采集模块

基于ERAS的药物跟进管理方法、装置、设备及介质

管理方法数据重构误差神经网络模型更新网络参数

一种适用于多场景动态图像的集成分析方法、系统、存储介质及程序产品

集成分析系统物体集成分析方法节奏特征图像采集设备

一种异构多模态数据的电梯停梯判别方法和装置

判别电梯机器学习模型电梯运行模式历史故障数据时间序列分析方法

文本处理方法、装置、电子设备、介质和程序产品

句法结构文本处理方法训练语言模型语义角色标注文本处理装置

问答模型训练方法、文本处理方法及奖励模型训练方法

站点导航

APP 下载