一种列式存储格式及分层索引优化的Hadoop的海量小文件读取方法

AITNT
正文
推荐专利
一种列式存储格式及分层索引优化的Hadoop的海量小文件读取方法
申请号:CN202510316534
申请日期:2025-03-18
公开号:CN120353759A
公开日期:2025-07-22
类型:发明专利
摘要
本发明属于计算机技术领域,公开了一种列式存储格式及分层索引优化的Hadoop的海量小文件读取方法,所述方法适用于在Hadoop平台中搭建有用于存储海量图片小文件及其属性信息的Hbase系统、以及分布式协调管理系统ZooKeeper,如下:向基于内存的热点缓存索引层的服务进程发起查询请求,根据一致性哈希算法查询热点缓存索引层中缓存的热点数据是否存在查询请求数据;若存在,则直接返回热点缓存索引层反馈的查询结果;若不存在,则将查询转发给基于Hbase的持久化索引存储层进行查询,并返回查询结果;所述持久化索引存储层存储包括基于HBase的图片存储策略建立用于存储图片小文件及其属性信息的HBase原始表、以及根据HBase原始表中的非行键属性建立的索引表。
技术关键词
索引表 热点 格式 图片 数据预测模型 分层 分布式协调 读取方法 哈希算法 线性回归方法 进程 管理系统 内存 增量更新 日志 策略 时间差
系统为您推荐了相关专利信息
1
一种多源空间数据融合处理系统及方法
多源空间数据融合 卫星影像数据 深度学习模型 构建分类器 遥感图像处理
2
医疗需求定制化对话方法、装置、设备及存储介质
智能对话模型 产品需求文档 语义向量 对话方法 生成框架
3
一种基于机器学习的消化系统肿瘤的筛查方法及系统
消化系统 胃肠镜 肿瘤 筛查方法 机器学习模型
4
基于信息摘要算法比对的合规关键词筛查方法和装置
摘要算法 文本 筛查方法 筛查装置 独立语义
5
数据迁移方法、装置、计算机设备及存储介质
数据迁移方法 语句 策略 格式化 计算机设备
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号