摘要
本申请实施例涉及智能对话技术领域,公开了一种训练对话模型的方法,该方法包括:获取若干组对话样本,对话样本包括至少一个问题语句和至少一个回复语句,其中,最后一个回复语句标注为真实标签;从对话样本中分层面获取全局层面的全局文本和说话者层面的说话者文本;将全局文本和说话者文本输入生成网络进行先编码后解码处理,得到预测标签;计算预测标签和真实标签之间的损失,并根据若干组对话样本对应的损失和,对生成网络进行迭代训练,直至收敛,得到对话模型。如此,使得生成网络更好地理解对话样本的上下文逻辑关系,能够有效提高训练得到的对话模型回复的准确性和连贯性。
技术关键词
特征提取模块
注意力
语义向量
非暂态计算机可读存储介质
文本
前馈神经网络
语句
计算机可执行指令
标签
样本
智能对话技术
长短记忆网络
编码模块
解码器
分词
处理器