一种基于原子句子的双粒度文本检索方法

AITNT
正文
推荐专利
一种基于原子句子的双粒度文本检索方法
申请号:CN202510799592
申请日期:2025-06-16
公开号:CN120821825A
公开日期:2025-10-21
类型:发明专利
摘要
本申请涉及一种基于原子句子的双粒度文本检索方法,包括:针对每个用户查询,计算用户查询对应的查询向量与每个文本块向量之间的余弦相似度,将所有余弦相似度进行降序排序,选取前4K个余弦相似度对应的文本块,作为用户查询对应的第一检索结果;针对第一检索结果中的每个文本块,计算查询向量与文本块对应的所有原子句子之间的余弦相似度,选取最大的余弦相似度作为文本块对应的原子句子相似度得分;根据文本块相似度得分和文本块对应的原子句子相似度得到用户查询最终的检索结果。本申请同时使用原文本块检索和原子句子检索,不仅保证文本的全局语义,更充分关注文本的各局部信息,能够真正提高检索的准确率,且适用于企业私人领域数据。
技术关键词
文本检索方法 文本检索装置 可读存储介质 计算机程序产品 组合模块 处理器 指令 语义 企业 数据
系统为您推荐了相关专利信息
1
火车外观状态识别模型生成方法、系统、设备及介质
识别模型生成方法 火车车厢 前端采集系统 深度学习网络模型 原始图像数据
2
一种模型参数存储方法、设备及存储介质
模型参数存储方法 人工智能芯片技术 计算机设备 执行设备 布局
3
一种智能合约消歧方法、装置、设备及存储介质
消歧方法 服务器 模板 多义词 语义
4
一种路口通行决策方法、装置、设备及介质
车道中心线 交通灯信息 决策方法 车道线信息 显示状态控制
5
基于知识图谱的语言模型查询请求处理方法与服务设备
语义特征 实体 图谱 服务设备 可读存储介质
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号