摘要
本申请公开了一种基于大模型的多轮对话方法、装置、设备及存储介质,涉及自然语言处理领域,包括:从历史对话中筛选出与当前轮次对话对应的目标轮次对话;提取当前轮次对话和目标轮次对话的三元组信息,并基于当前轮次对话对应的领域数据和三元组信息构建目标提示词;三元组信息包括意图信息、实体信息和槽位信息;将目标提示词输入至预设对话大模型中,确定目标提示词的目标键值缓存,和目标轮次对话对应的历史键值缓存;基于目标键值缓存和历史键值缓存生成当前轮次对话的对话答复。通过计算历史对话与当前轮的语义相似度,结合实体识别,仅保留部分内容,有效降低了对话所用内存,避免逻辑断裂,并通过键值缓存复用,有效提高显存使用效率。
技术关键词
多轮对话方法
键值
语义向量
实体
三元组
自然语言
线性回归模型
预训练模型
存储计算机程序
适配器
意图
模型更新
电子设备
分词
处理器
可读存储介质
模块
存储器
数据
系统为您推荐了相关专利信息
SysML模型
航天器
模式
知识图谱数据
历史故障信息
访问控制规则
动态
防护系统
操作系统信息
生成方法