摘要
本发明公开了一种过滤向量检索方法、系统、设备及存储介质,它们是对应的方案,方案中:通过在近邻图之上引入独立的过滤树结构,使得过滤逻辑在检索过程中能够被高效下推,所有候选节点在进入近邻图前即可满足过滤条件,从而有效规避低选择率场景下的大量无效候选生成与随机I/O访问;同时,保持近邻图结构不变,确保在无过滤检索场景下的高性能不被削弱。此外,本发明还通过引入融合空间邻近性与标签一致性的混合式倒排结构,将语义标签相同且距离相近的向量聚合为统一簇,进一步加速了低选择率查询中的检索结果输出过程。得益于以上改进,本发明在过滤精度、查询延迟与系统吞吐等方面均取得了平衡。
技术关键词
向量检索方法
节点
数据
空间结构
磁盘
队列
聚类
分段
策略
内存
语义标签
检索系统
处理器
可读存储介质
索引
布局
场景
高性能
阶段