一种基于多视角向量融合的深度稠密文档召回方法

正文

推荐专利

申请号：CN202510638723

申请日期：2025-05-19

公开号：CN120409494A

公开日期：2025-08-01

类型：发明专利

摘要

本申请涉及自然语言处理和信息检索技术领域，公开了一种基于多视角向量融合的深度稠密文档召回方法，包括以下步骤：S1、对用户查询和候选文档进行预处理，生成标准化文本；S2、分别构建查询和文档的多视角语义向量表示，多视角至少包括关键词视角、语义扩展视角和意图视角；S3、对每个语义视角计算查询与文档的相似度得分，并通过动态权重融合各视角得分；S4、根据融合得分对文档排序，返回前Top‑K结果。通过构建关键词、语义扩展及意图视角的多维度语义表示，有效融合术语精确匹配、上下文关联及任务目标一致性等多重语义信息。动态权重分配机制根据查询内容自适应调节各视角贡献度，克服单一视角语义覆盖不足的缺陷。

技术关键词

多视角向量召回方法语义向量关键词独立编码器训练分类器识别查询意图抽取算法大语言模型权重分配机制信息检索技术命名实体识别意图类别生成向量动态注意力

一种基于多视角向量融合的深度稠密文档召回方法

站点导航

APP 下载