一种基于原子句子的双粒度文本检索方法

正文

推荐专利

一种基于原子句子的双粒度文本检索方法

申请号：CN202510799592

申请日期：2025-06-16

公开号：CN120821825A

公开日期：2025-10-21

类型：发明专利

摘要

本申请涉及一种基于原子句子的双粒度文本检索方法，包括：针对每个用户查询，计算用户查询对应的查询向量与每个文本块向量之间的余弦相似度，将所有余弦相似度进行降序排序，选取前4K个余弦相似度对应的文本块，作为用户查询对应的第一检索结果；针对第一检索结果中的每个文本块，计算查询向量与文本块对应的所有原子句子之间的余弦相似度，选取最大的余弦相似度作为文本块对应的原子句子相似度得分；根据文本块相似度得分和文本块对应的原子句子相似度得到用户查询最终的检索结果。本申请同时使用原文本块检索和原子句子检索，不仅保证文本的全局语义，更充分关注文本的各局部信息，能够真正提高检索的准确率，且适用于企业私人领域数据。

技术关键词

文本检索方法文本检索装置可读存储介质计算机程序产品组合模块处理器指令语义企业数据

系统为您推荐了相关专利信息

火车外观状态识别模型生成方法、系统、设备及介质

识别模型生成方法火车车厢前端采集系统深度学习网络模型原始图像数据

一种模型参数存储方法、设备及存储介质

模型参数存储方法人工智能芯片技术计算机设备执行设备布局

一种智能合约消歧方法、装置、设备及存储介质

消歧方法服务器模板多义词语义

一种路口通行决策方法、装置、设备及介质

车道中心线交通灯信息决策方法车道线信息显示状态控制

基于知识图谱的语言模型查询请求处理方法与服务设备

语义特征实体图谱服务设备可读存储介质

一种基于原子句子的双粒度文本检索方法

站点导航

APP 下载