摘要
本申请实施例公开了一种文本知识挖掘及对话生成方法、设备及介质。属于文本挖掘技术领域,解决文本处理模型的输出准确性较低的问题。包括,将获取到的文本知识进行语义分析,并基于语义关联度将文本知识划分为多个短句;基于深度学习词向量生成技术,将多个短句分别转换为低维词向量数据,对多个低维词向量数据进行加权平均处理,得到文本知识对应的句子向量;基于句子向量之间的映射关系,将句子向量存储至向量数据库;获取所文本知识对应的行业文本数据,基于行业文本数据对预置chatglm模型进行微调;将获取到的问题文本进行向量化处理,并基于向量化处理后的问题、向量数据库以及微调后的预置chatglm模型生成答案文本。
技术关键词
对话生成方法
语义关联度
生成技术
词嵌入模型
非易失性计算机存储介质
计算机可执行指令
生成答案
预置输出值
文本挖掘技术
数据
文本处理模型
构建用户画像
计算机程序指令
词语
存储计算机程序
生成设备
分词
系统为您推荐了相关专利信息
图像生成模型
大语言模型
图像生成方法
语义向量
文本编码器
能源管理方法
皮尔逊相关系数
引入注意力机制
非易失性计算机存储介质
计算机可执行指令
数据验证方法
实体间关系
表单特征
表单页面
非线性