摘要
本说明书公开了一种问答模型训练方法、装置、存储介质及电子设备。在本说明书提供的问答模型训练方法中,获取咨询案例,咨询案例包括咨询服务提供方与咨询用户之间的咨询记录;对咨询案例进行语义拆解,得到问题元素、对象元素以及咨询元素,其中,问题元素用于表征咨询案例涉及的问题信息,对象元素用于表征咨询用户的信息,咨询元素用于表征咨询服务提供方的信息;构建包含状态、动作、奖励的三元组,其中,状态是根据问题元素和对象元素确定的,动作是根据咨询元素确定的,奖励是根据咨询案例的咨询结果与对象元素确定的;根据状态、动作和奖励,对预先训练的第一问答模型进行强化学习,得到目标问答模型。
技术关键词
问答模型训练方法
元素
对象
三元组
样本
电子设备
处理器
语义
文本
训练装置
可读存储介质
模块
存储器
参数
计算机
程序
系统为您推荐了相关专利信息
故障实体
故障分析模型
组网设备
历史故障数据
图谱
体外诊断设备
光电倍增管
人机交互模块
微流控芯片
嵌入式处理器
预训练语言模型
大语言模型
文本
数据处理方法
样本
二次约束二次规划
信号分析方法
节点更新
变量
非暂态计算机可读存储介质