一种面向分布式云原生存储的小文件合并优化方法

AITNT
正文
推荐专利
一种面向分布式云原生存储的小文件合并优化方法
申请号:CN202510311863
申请日期:2025-03-17
公开号:CN120162006A
公开日期:2025-06-17
类型:发明专利
摘要
本发明公开了一种面向分布式云原生存储的小文件合并优化方法,该方法通过分析HDFS访问日志,将数据转化为适合分析的结构,提出基于用户访问模式的关联性分析算法。使用FP‑Growth算法从文件访问记录中发现关联规则:通过构建FP树压缩事务数据并确定频繁项集,从频繁项集中生成符合支持度和置信度的关联规则。按照上述生成的规则对关联性强弱不同的小文件分别处理:寻找关联性强的小文件,采用基于Huffman树的小文件合并策略对文件进行合并;对于关联性弱的小文件,不断将其加入等待队列,当队列满足HDFS数据节点存储大小条件时进行合并存储。本发明优化了HDFS的文件存储空间,提高了海量小文件的访问效率。属于关联性分析和小文件存储领域。
技术关键词
合并优化方法 分布式云 节点 海量小文件 数据存储设备 FP‑Growth算法 队列 数据服务器 HDFS文件系统 关联性分析算法 数据项 字典 编码 元素 定义规则 分支 机制 树根 索引
系统为您推荐了相关专利信息
1
一种基于大语言模型嵌入的图注意力强化学习学习路径推荐方法、系统、设备及存储介质
学习路径推荐方法 大语言模型 知识点 强化学习方法 LSTM神经网络
2
一种基于内容特性与传播效果的投放分析方法及系统
投放分析方法 网络节点 关键词 原创性 指标
3
一种基于通信数据处理的网络安全管理方法
网络安全管理方法 员工 网络安全监测 发送消息 分析网络流量
4
一种项目过程与质量工具融合的方法
项目 计划 生成报告 算法 优化资源配置
5
一种探干一体化系统的功率-频率联合资源管控技术
一体化系统 粒子 元素 资源管控方法 功率
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号