一种信息生成和模型训练方法、装置、存储介质及设备

正文

推荐专利

申请号：CN202510585936

申请日期：2025-05-07

公开号：CN120633826A

公开日期：2025-09-12

类型：发明专利

摘要

本说明书提供了一种信息生成和模型训练方法、装置、存储介质及设备。在此方法中，获取多轮对话中最新一轮对话的当前输入数据和至少一个历史轮次对话的历史对话数据；构建针对预先训练的问答模型的提示词；提示词中包含按时间顺序依次排列的历史对话数据和当前输入数据；将提示词输入问答模型，以使问答模型针对提示词中的每个token，若该token所在的输入文本为查询文本，则基于双向注意力机制确定该token对应的输出特征表示，若该token所在的输入文本为检索结果或答复信息，则基于单向注意力机制确定该token对应的输出特征表示，以及，根据提示词中的每个token对应的输出特征表示，生成最新一轮对话的答复信息。本方案提高了多轮对话的连贯性和答复信息的准确性。

技术关键词

问答模型输出特征双向注意力机制文本多轮对话模型训练方法数据信息生成方法信息生成装置模型训练装置处理器指令计算机程序产品输入模块可读存储介质偏差电子设备

系统为您推荐了相关专利信息

知识蒸馏方法、装置、设备及存储介质

关键词知识蒸馏方法图谱设备故障诊断文本

一种基于强化学习的语言模型预训练方法及系统

策略群智能优化算法模型预训练文本模块

一种页面信息提取方法、装置及电子设备

页面信息提取方法信息提取模型节点资源定位符校验信息

一种数据召回方法、装置及相关产品

结构化查询语言召回方法模版数据嵌入语义向量

融合显性特征和隐性特征的古文命名实体识别模型

隐性特征前馈神经网络 Word2Vec模型语义向量交叉注意力机制

一种信息生成和模型训练方法、装置、存储介质及设备

站点导航

APP 下载