摘要
本发明属于分布式计算技术领域,涉及一种大规模数据的分布式处理方法。为了解决现有技术中在分布式架构下对数据的处理大都依靠统一的数据处理算法对数据进行处理,多个计算节点之间的分工并不明确。本发明通过将待处理文件进行分类,且依据每一类存储节点中的待处理文件的数据大小和数据结构,以及不同算法对不同数据的处理能力,将不同处理文件和不同算法对应的计算节点之间生成映射关系,使得在数据处理过程中能够充分适配计算节点,每个计算节点都能够处理自身所擅长的数据,使得计算节点处理数据的效率大大提高。
技术关键词
数据处理算法
存储集群
节点
决策树模型
图形数据结构
分布式计算技术
树形数据结构
文件扩展名
分布式架构
逻辑
标记
关系
处理器
语义
线性
系统为您推荐了相关专利信息
深度神经网络模型
风险预测方法
拓扑图
风险预测装置
序列数据处理
信息智能管理系统
SPARQL查询
长短期记忆网络
实体
社交