一种多维流式全量索引方法

正文

推荐专利

一种多维流式全量索引方法

申请号：CN202411543268

申请日期：2024-10-31

公开号：CN119474095A

公开日期：2025-02-18

类型：发明专利

摘要

本文公开了一种多维流式全量索引SFI‑HBase(Streaming Full Index HBase)方法，包括以下步骤：SFI‑HBase在插入数据时，先将数据写入存储层，同时向Kafka发送消息。Spark Streaming从Kafka拉取数据后，先在内存更新索引，再更新HBase全量索引层。读取时，SFI‑HBase的范围查询、KNN查询通过全量索引层获取索引后访问存储层，点查询直接访问存储层。本文提出的二分混合空间填充曲线结合Z曲线和Hilbert曲线，支持多维空间划分，提升局部性20％以上，聚集度50％以上。基于此降维数据，SFI‑HBase构建了高效的多维索引结构。在插入时，利用Spark Streaming聚合存储数据，支持并发插入；查询时，全量索引层存储不同粒度索引，可根据查询条件选择粒度。相较MD‑HBase，SFI‑HBase范围查询效率提升10％，KNN查询效率提升5倍，插入效率提升10倍。

技术关键词

空间填充曲线数据索引表存储表查询算法多维索引结构存储结构块边界分区球体超参数内存索引方法增量更新树状结构节点发送消息存储桶

系统为您推荐了相关专利信息

一种基于谐波阻抗的多源融合智能电网谐波动态管理系统

动态管理系统智能电网设备故障概率节点数据采集模块

数智水务全域数据运行决策分析综合服务系统

综合服务系统水务系统状态诊断贝叶斯神经网络三维模型

一种基于多源数据融合与智能决策的环境监测系统及方法

环境监测方法数据处理中心决策无线通信模块环境监测系统

基于动态补偿的输液泵控制方法、设备及存储介质

输液泵控制方法温度补偿系数传感器阵列初始弹性模量动态

一种基于双视图图神经网络的多阶段基因调控网络推断方法

基因调控网络推断方法动态门控编码器多阶段

一种多维流式全量索引方法

站点导航

APP 下载