摘要
本发明涉及计算机应用技术领域,公开一种海量文件数据流的存储方法、存储系统及大数据处理系统,在数据流和存储节点之间部署轮转状态转换模型,通过多节点缓存分散存储压力。存储方法包括:预设文件大小分界点;海量文件数据输入,逐一判断输入的文件大小是否小于等于分界点;小于等于分界点的文件数据通过轮转状态转换模型存储在选定的存储节点中;生成所有小文件的索引信息,并将索引信息合并至索引文件,每个索引文件均以B+树的形式组织数据,以获得索引数据桶;多个索引数据桶均以数据块形式存储在存储节点,将所有索引数据桶按顺序保存为索引数据桶队列。本发明能有效解决传统分布式存储系统面对海量文件时写性能下降,效率低等问题。
技术关键词
状态转换模型
存储方法
索引
海量文件数据
队列
数据存储
大数据处理系统
数据并行写入
分布式存储系统
负载均衡策略
多节点
主节点
哈希技术
模块
组织
内存
系统为您推荐了相关专利信息
化疗疗效预测
局部进展期
模型构建方法
进展期胃癌
队列
医学专业
医学知识图谱
实体识别模型
问答方法
文本
决策树模型
推理方法
节点
全同态加密算法
二叉决策树
血清
生物标志物
miRNA芯片
机器学习驱动
机器学习算法