一种多轮对话模型训练方法、装置及相关设备

正文

推荐专利

申请号：CN202510777393

申请日期：2025-06-11

公开号：CN120687567A

公开日期：2025-09-23

类型：发明专利

摘要

本申请提供了一种多轮对话模型训练方法、装置及相关设备，涉及人工智能技术领域，所述方法包括获取第一文本对应的第一分词序列以及多个连续的第二文本，第一分词序列包括N‑1个词元、掩码标记和分类标记，第一分词序列根据第一文本对应的第二分词序列进行预处理得到，第二分词序列包括N个词元；计算预设模型基于N‑1个词元确定的实体损失、基于掩码标记确定的掩码损失、基于分类标记确定的意图损失以及基于第一文本和第二文本确定的对话序列损失，得到第一损失值；基于第一损失值对预设模型进行迭代训练，以得到多轮对话模型。使得多轮对话模型在处理复杂对话时可以准确捕捉关键信息，提升了多轮对话模型输出结果的准确性。

技术关键词

多轮对话文本意图标记模型训练方法序列实体注意力编码器参数分词模型训练装置条件随机场标签可读存储介质人工智能技术解码器处理器

一种多轮对话模型训练方法、装置及相关设备

站点导航

APP 下载