摘要
本发明涉及基于分布式架构的大数据智能分析处理系统和方法,该系统包括依次连接的数据采集模块、混合处理模块、智能数据分流模块、数据重组模块和数据分析模块,先从多源异构数据源中经增量抽取和批量抽取双通道分别获取实时大数据和批量大数据,实时大数据用CDC技术、两阶段提交入消息队列,批量大数据按时间戳/自增ID增量存分布式库;混合处理时,智能资源调度器借资源分配函数与集群状态评估做决策,任务分发器分解任务并动态加权分发;智能分流依规则与信息熵划分高频、低频数据;再经数据重组建立时间映射加权融合,最后分析重组数据,能够实现资源高效调度、数据精准分流与深度分析,兼顾实时性与可靠性,并提高了数据处理效率与分析精度。
技术关键词
分布式架构
资源分配
大数据
批量
数据分析模块
两阶段提交
动态规则引擎
节点
数据采集模块
集群
滑动窗口算法
分发器
信息熵
租约机制
分布式数据库
数据随时间
复杂度
系统为您推荐了相关专利信息
清洗规则
计算机可读程序
数据清洗效率
业务数据类型
频率
产品表面缺陷
综合评价模型
缺陷分析
节点
显示平台
故障预测模型
性能退化模型
故障分析方法
实验室设备
故障特征提取
硅基集成芯片
波导结构
光纤阵列
光电探测器
支路