摘要
本申请公开了一种基于分布式流处理的大数据分析方法、设备及介质,方法包括:采集数据源的数据,将数据进行格式转换,以对格式转换后的数据进行流处理;通过流处理引擎将数据进行划分,以得到多个子流,对多个子流进行并行处理,以得到并行结果;根据并行结果进行实时分析,以得到决策信息,将决策信息保存至数据库中。本申请通过分布式流处理引擎,实现了大数据的实时处理和分析,提高了处理效率;采用滑动窗口算法,在有限的内存和计算资源下实现实时统计和分析;实时分析模块可以提取出有价值的信息,为用户提供决策支持;结果存储模块为后续的数据挖掘和分析提供了数据支持。
技术关键词
滑动窗口算法
分布式流
数据分析方法
数据分析设备
决策
格式
分布式数据库
非易失性计算机存储介质
计算机可执行指令
机器学习算法
处理器通信
时间段
队列
分析模块
存储模块
消息
存储器
节点
系统为您推荐了相关专利信息
机器学习算法融合
医疗保险欺诈检测
识别方法
数据
Pearson相关系数
光学成像卫星
演化算法
卫星动力学
模拟退火算法
决策
储能设备
数据分析方法
神经网络模型
数据帧结构
建立通信
云端智能决策
电刺激治疗系统
深度学习算法
柔性电极
扫描成像设备
健康数据分析方法
健康风险评估
狼群算法
编码器
高维数据空间