摘要
本申请涉及自然语言处理和信息检索技术领域,公开了一种基于多视角向量融合的深度稠密文档召回方法,包括以下步骤:S1、对用户查询和候选文档进行预处理,生成标准化文本;S2、分别构建查询和文档的多视角语义向量表示,多视角至少包括关键词视角、语义扩展视角和意图视角;S3、对每个语义视角计算查询与文档的相似度得分,并通过动态权重融合各视角得分;S4、根据融合得分对文档排序,返回前Top‑K结果。通过构建关键词、语义扩展及意图视角的多维度语义表示,有效融合术语精确匹配、上下文关联及任务目标一致性等多重语义信息。动态权重分配机制根据查询内容自适应调节各视角贡献度,克服单一视角语义覆盖不足的缺陷。
技术关键词
多视角向量
召回方法
语义向量
关键词
独立编码器
训练分类器
识别查询意图
抽取算法
大语言模型
权重分配机制
信息检索技术
命名实体识别
意图类别
生成向量
动态
注意力