训练对话模型的方法、对话实现方法及相关装置

正文

推荐专利

申请号：CN202410942681

申请日期：2024-07-15

公开号：CN118536572B

公开日期：2024-11-15

类型：发明专利

摘要

本申请实施例涉及智能对话技术领域，公开了一种训练对话模型的方法，该方法包括：获取若干组对话样本，对话样本包括至少一个问题语句和至少一个回复语句，其中，最后一个回复语句标注为真实标签；从对话样本中分层面获取全局层面的全局文本和说话者层面的说话者文本；将全局文本和说话者文本输入生成网络进行先编码后解码处理，得到预测标签；计算预测标签和真实标签之间的损失，并根据若干组对话样本对应的损失和，对生成网络进行迭代训练，直至收敛，得到对话模型。如此，使得生成网络更好地理解对话样本的上下文逻辑关系，能够有效提高训练得到的对话模型回复的准确性和连贯性。

技术关键词

特征提取模块注意力语义向量非暂态计算机可读存储介质文本前馈神经网络语句计算机可执行指令标签样本智能对话技术长短记忆网络编码模块解码器分词处理器

训练对话模型的方法、对话实现方法及相关装置

站点导航

APP 下载