摘要
本申请提供了一种多轮对话模型训练方法、装置及相关设备,涉及人工智能技术领域,所述方法包括获取第一文本对应的第一分词序列以及多个连续的第二文本,第一分词序列包括N‑1个词元、掩码标记和分类标记,第一分词序列根据第一文本对应的第二分词序列进行预处理得到,第二分词序列包括N个词元;计算预设模型基于N‑1个词元确定的实体损失、基于掩码标记确定的掩码损失、基于分类标记确定的意图损失以及基于第一文本和第二文本确定的对话序列损失,得到第一损失值;基于第一损失值对预设模型进行迭代训练,以得到多轮对话模型。使得多轮对话模型在处理复杂对话时可以准确捕捉关键信息,提升了多轮对话模型输出结果的准确性。
技术关键词
多轮对话
文本
意图
标记
模型训练方法
序列
实体
注意力
编码器参数
分词
模型训练装置
条件随机场
标签
可读存储介质
人工智能技术
解码器
处理器