摘要
本申请涉及一种基于原子句子的双粒度文本检索方法,包括:针对每个用户查询,计算用户查询对应的查询向量与每个文本块向量之间的余弦相似度,将所有余弦相似度进行降序排序,选取前4K个余弦相似度对应的文本块,作为用户查询对应的第一检索结果;针对第一检索结果中的每个文本块,计算查询向量与文本块对应的所有原子句子之间的余弦相似度,选取最大的余弦相似度作为文本块对应的原子句子相似度得分;根据文本块相似度得分和文本块对应的原子句子相似度得到用户查询最终的检索结果。本申请同时使用原文本块检索和原子句子检索,不仅保证文本的全局语义,更充分关注文本的各局部信息,能够真正提高检索的准确率,且适用于企业私人领域数据。
技术关键词
文本检索方法
文本检索装置
可读存储介质
计算机程序产品
组合模块
处理器
指令
语义
企业
数据
系统为您推荐了相关专利信息
识别模型生成方法
火车车厢
前端采集系统
深度学习网络模型
原始图像数据
模型参数存储方法
人工智能芯片技术
计算机设备
执行设备
布局
车道中心线
交通灯信息
决策方法
车道线信息
显示状态控制