摘要
本发明公开了一种基于分布式计算与混合索引的高维数据检索方法,包括如下步骤:步骤1、数据预处理;步骤2、聚类生成;步骤3、索引构建;步骤4、一致性哈希:将每个簇分配到哈希环的虚拟节点,并根据负载策略动态调整虚拟节点上的数据分配,再把虚拟节点映射到物理服务器;步骤5、分层聚合:将查询请求通过哈希函数映射到哈希环上的一个节点及其相邻节点,并行进行候选集计算,再由Spark中心节点合并各个节点发送的候选集,最后优化结果。这种方法通过混合索引构建、动态一致性哈希分配及分层聚合策略,实现高召回率、低延迟的分布式检索,同时保障系统负载均衡与索引更新效率,适用于大规模高维数据场景。
技术关键词
高维数据检索方法
节点
大规模高维数据
生成树
聚类
Prim算法
分布式计算框架
稳定性准则
负载均衡策略
索引策略
动态
邻居
保障系统
分层
低延迟
服务器
定义
系统为您推荐了相关专利信息
电力系统网络攻击
网络攻击场景
故障传播路径
双层优化模型
电力系统安全防护
康复评估方法
支持向量机模型
面积特征
康复评估设备
高斯混合模型
医疗不良事件
防控方法
风险预测模型
节点特征
高风险
文本情感识别方法
概念
情感类别
多层次
情感识别装置
液冷电缆
温度预测模型
监测预警方法
工况
状态诊断