基于文件合并及热度和时效双重淘汰机制的Hadoop的海量小文件读取方法

正文

推荐专利

申请号：CN202510221087

申请日期：2025-02-27

公开号：CN120067070B

公开日期：2025-12-23

类型：发明专利

摘要

本发明属于计算机技术领域，公开了一种基于文件合并及热度和时效双重淘汰机制的Hadoop的海量小文件读取方法，如下：接收用户输入的小文件读取请求，判定读取请求的文件是否为小文件；若不是，则向HDFS系统中的NameNode发送请求，所述NameNode根据元数据信息从DataNode中读取相应的文件；若是，则按照小文件完整路径查询Redis缓存模块，若Redis缓存模块中缓存有请求读取的小文件，则直接返回读取小文件给用户；所述Redis缓存模块根据缓存更新策略缓存有部分热度小文件，所述热度小文件是采用基于热点和时效的双重淘汰机制的热度计算公式构建的小文件访问预测模块预测得到的；若Redis缓存模块中没有请求读取的小文件，则向HDFS系统中的NameNode发送请求，所述NameNode根据元数据信息从DataNode中读取相应的文件。

技术关键词

海量小文件读取方法 HDFS系统机制读取小文件模块数据合并方法缓存过期时间策略配置网络参数队列模型更新动态更新周期热点集群日志索引进程

系统为您推荐了相关专利信息

一种结合实验室视频数据解析的异常行为识别方法及系统

序列监控设备监测识别方法图像组合样本

一种施工场地设施布置方法、装置、设备及介质

三维模型布置方法施工场地遗传算法物料搬运

一种基于多模态数据融合的骨骼肌肉疾病智能诊断系统

智能诊断系统多模态数据融合组学特征诊断模块集成学习方法

基于人工智能的服装交互设计系统及方法

交互设计系统客户服装编码向量多级特征

一种基于大模型的主观题试卷阅卷方法

主观题试卷答案阅卷方法多头注意力机制语义

基于文件合并及热度和时效双重淘汰机制的Hadoop的海量小文件读取方法

站点导航

APP 下载