摘要
本申请公开了一种文本检索方法、装置、设备及存储介质,其包括:获取待查重文本;将待查重文本输入文本结构识别模型,得到待查重文本中的多个结构框架;对于每个结构框架分别执行以下操作:通过对结构框架所对应的文本内容进行分词操作,确定结构框架中M个特征词,以及每个特征词所对应的权重值;根据每个特征词的权重值,从待查重文本中选取得到N个关键词;利用N个关键词对应的目标权重向量,在文本库中检索得到待查重文本的相似文本。基于此,在检索过程中,通过提取待查中文本中每个结构框架对应的文本内容中的关键词,根据关键词的目标权重向量去检索得到相似文本,从而提高了相似文本的检索准确率以及检索效率。
技术关键词
结构框架
关键词
文本检索方法
计算机程序指令
训练神经网络模型
分词
训练样本集
文本检索装置
计算机程序产品
可读存储介质
解码器
标签
处理器
编码器
电子设备
识别模块
系统为您推荐了相关专利信息
谣言传播模型
节点
计算机程序指令
计算机程序产品
处理器
字段
节点
深度优先搜索算法
元数据管理方法
标记
声学特征
关键词识别方法
校验模块
深度神经网络
三元组
历史运行数据
转移方法
遗传算法优化
线性回归模型
策略
关键词提取模型
生成提示词
文本关键词提取
算法
构建训练集