摘要
本申请涉及数据处理技术领域,公开了基于大数据的文件解析存储划分方式及分布式存储系统,包括以下步骤:S1、文件解析:解析输入的大数据文件,提取其逻辑结构、字段内容及关联关系;S2、数据块生成:将解析结果划分为数据块,并生成其大小及关联性信息;S3、关联权重生成:建立数据块之间的相似性和联合访问频率的权重关系;S4、存储划分优化:基于关联权重,优化数据块在存储节点间的分布。本发明通过关联权重生成和动态决策模块的协同作用,优化数据块的分布,使关联度高的数据块优先分配到同一存储节点,极大地减少了跨节点的数据传输,使其可以实时调整存储策略,从而降低因跨节点访问导致的通信延迟和网络资源消耗。
技术关键词
分布式存储系统
大数据
元数据管理模块
策略
动态调整机制
强化学习方法
动态迁移数据
存储节点故障
数据块迁移
生成数据块
强化学习算法
深度神经网络
协作关系
决策
数据处理技术
频率
系统为您推荐了相关专利信息
数据处理方法
环境感知设备
机载温度传感器
空气质量检测器
线性
业务系统
数据同步接口
日志
模板
计算机程序产品
智慧农业大棚
生理健康指数
农药残留数据
控制策略
植物健康
退化草原
生态需水
生态修复方法
网格
河湖生态补水