摘要
本申请提出一种问答模型训练方法、行业知识问答方法、装置及设备,应用于自然语言技术领域。其中,问答模型训练方法包括:获取目标行业的初始问答模型,初始问答模型是基于第一问答对训练得到的,第一问答对的问答形式为一问一答;获取目标行业的问答奖励模型,问答奖励模型是基于第二问答对训练得到的,第二问答对的问答形式为一问多答,第一问答对和第二问答对中的答案是以思维链的方式进行描述的;基于问答奖励模型和目标行业的问句样本,对初始问答模型进行强化学习训练,得到目标行业的知识问答模型。从而,大语言模型能够进行符合用户偏好的行业知识回答,通过思维链方式对行业问题进行完整思考,提高了行业知识回答的准确性。
技术关键词
问答模型训练方法
答案
知识问答方法
关键词
文本
自然语言技术
框架
大语言模型
数据
计算机程序产品
处理器
样本
变量
存储器
网络
算法
参数
策略
电子设备
系统为您推荐了相关专利信息
文本处理方法
预训练语言模型
大语言模型
风格
计算机可读指令
自主学习功能
智能机器人
答案
资料
生成特征向量