文本检索方法、装置、设备及存储介质

正文

推荐专利

文本检索方法、装置、设备及存储介质

申请号：CN202411081326

申请日期：2024-08-07

公开号：CN119089888A

公开日期：2024-12-06

类型：发明专利

摘要

本申请公开了一种文本检索方法、装置、设备及存储介质，其包括：获取待查重文本；将待查重文本输入文本结构识别模型，得到待查重文本中的多个结构框架；对于每个结构框架分别执行以下操作：通过对结构框架所对应的文本内容进行分词操作，确定结构框架中M个特征词，以及每个特征词所对应的权重值；根据每个特征词的权重值，从待查重文本中选取得到N个关键词；利用N个关键词对应的目标权重向量，在文本库中检索得到待查重文本的相似文本。基于此，在检索过程中，通过提取待查中文本中每个结构框架对应的文本内容中的关键词，根据关键词的目标权重向量去检索得到相似文本，从而提高了相似文本的检索准确率以及检索效率。

技术关键词

结构框架关键词文本检索方法计算机程序指令训练神经网络模型分词训练样本集文本检索装置计算机程序产品可读存储介质解码器标签处理器编码器电子设备识别模块

系统为您推荐了相关专利信息

模拟谣言传播的方法及相关设备

谣言传播模型节点计算机程序指令计算机程序产品处理器

基于数据源可扩展的集成式元数据管理方法及系统

字段节点深度优先搜索算法元数据管理方法标记

用于语音的关键词识别方法、系统、电子设备和存储介质

声学特征关键词识别方法校验模块深度神经网络三元组

一种基于双GPU架构的任务转移方法、设备及介质

历史运行数据转移方法遗传算法优化线性回归模型策略

基于大模型的行业文本关键词提取方法、装置、设备及介质

关键词提取模型生成提示词文本关键词提取算法构建训练集

文本检索方法、装置、设备及存储介质

站点导航

APP 下载