摘要
本发明属于自然语言处理技术领域,其公开了一种对话系统历史对话筛选方法及装置,解决传统技术中的历史对话筛选方案存在的可能遗漏跨时间、跨主题的内容,难以处理无明显关键词的对话导致筛选结果偏离用户期望,对缺乏明显意图的对话筛选效果差的问题。该方法包括:基于对话的时间和主题存储用户与对话系统之间的历史对话数据;在进行历史对话筛选时,首先计算当前问句与存储的历史对话数据的相似度,包括语义相似度、关键词相似度、主题相似度和上下文相似度的加权融合;然后基于预先设置的对话筛选阈值,结合当前问句与存储的历史对话数据的相似度计算结果,从存储的历史对话数据中筛选出与当前问句最相关的历史对话数据。本发明适用于对话系统。
技术关键词
对话系统
筛选方法
关键词
大语言模型
数据
度计算方法
语义
主题词向量
算法
主题模型
筛选装置
自然语言
模板
存储模块
多层次
连续性
意图