摘要
本说明书提供了一种信息生成和模型训练方法、装置、存储介质及设备。在此方法中,获取多轮对话中最新一轮对话的当前输入数据和至少一个历史轮次对话的历史对话数据;构建针对预先训练的问答模型的提示词;提示词中包含按时间顺序依次排列的历史对话数据和当前输入数据;将提示词输入问答模型,以使问答模型针对提示词中的每个token,若该token所在的输入文本为查询文本,则基于双向注意力机制确定该token对应的输出特征表示,若该token所在的输入文本为检索结果或答复信息,则基于单向注意力机制确定该token对应的输出特征表示,以及,根据提示词中的每个token对应的输出特征表示,生成最新一轮对话的答复信息。本方案提高了多轮对话的连贯性和答复信息的准确性。
技术关键词
问答模型
输出特征
双向注意力机制
文本
多轮对话
模型训练方法
数据
信息生成方法
信息生成装置
模型训练装置
处理器
指令
计算机程序产品
输入模块
可读存储介质
偏差
电子设备
系统为您推荐了相关专利信息
页面信息提取方法
信息提取模型
节点
资源定位符
校验信息
结构化查询语言
召回方法
模版
数据嵌入
语义向量
隐性特征
前馈神经网络
Word2Vec模型
语义向量
交叉注意力机制