一种多维流式全量索引方法

AITNT
正文
推荐专利
一种多维流式全量索引方法
申请号:CN202411543268
申请日期:2024-10-31
公开号:CN119474095A
公开日期:2025-02-18
类型:发明专利
摘要
本文公开了一种多维流式全量索引SFI‑HBase(Streaming Full Index HBase)方法,包括以下步骤:SFI‑HBase在插入数据时,先将数据写入存储层,同时向Kafka发送消息。Spark Streaming从Kafka拉取数据后,先在内存更新索引,再更新HBase全量索引层。读取时,SFI‑HBase的范围查询、KNN查询通过全量索引层获取索引后访问存储层,点查询直接访问存储层。本文提出的二分混合空间填充曲线结合Z曲线和Hilbert曲线,支持多维空间划分,提升局部性20%以上,聚集度50%以上。基于此降维数据,SFI‑HBase构建了高效的多维索引结构。在插入时,利用Spark Streaming聚合存储数据,支持并发插入;查询时,全量索引层存储不同粒度索引,可根据查询条件选择粒度。相较MD‑HBase,SFI‑HBase范围查询效率提升10%,KNN查询效率提升5倍,插入效率提升10倍。
技术关键词
空间填充曲线 数据 索引表 存储表 查询算法 多维索引结构 存储结构 块边界 分区 球体 超参数 内存 索引方法 增量更新 树状结构 节点 发送消息 存储桶
系统为您推荐了相关专利信息
1
一种基于谐波阻抗的多源融合智能电网谐波动态管理系统
动态管理系统 智能电网 设备故障概率 节点 数据采集模块
2
数智水务全域数据运行决策分析综合服务系统
综合服务系统 水务系统 状态诊断 贝叶斯神经网络 三维模型
3
一种基于多源数据融合与智能决策的环境监测系统及方法
环境监测方法 数据处理中心 决策 无线通信模块 环境监测系统
4
基于动态补偿的输液泵控制方法、设备及存储介质
输液泵控制方法 温度补偿系数 传感器阵列 初始弹性模量 动态
5
一种基于双视图图神经网络的多阶段基因调控网络推断方法
基因调控网络 推断方法 动态门控 编码器 多阶段
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号