摘要
本发明公开了一种解决大数据系统高并发问题的批次表设计方法。搭建一个高可用的Hadoop集群、Redis双活集群、DolphinScheduler集群、Spark、Hive、Mysql;将每天T+1调度产生的业务数据全量存入Hive表中;同时将这份全量数据以特定的数组格式通过Spark计算存入Redis双活集群,形成一个最新批次;同时将批次信息记录到Mysql;基于Mysql的批次信息复查Redis双活集群;基于Redis双活集群定期清理过期批次数据;基于DolphinScheduler集群调度上述任务。
技术关键词
大数据系统
集群
阶段
任务调度执行
高可用
机制
备份
唯一性
格式
机器人
磁盘
发动机
内存
系统为您推荐了相关专利信息
模型获取方法
预测特征
交互特征
生成对抗网络
老师
风机监测方法
声纹特征
卷积神经网络模型
风险
报警策略
校验算法
阶段
验证方法
数据一致性验证
设备存储介质
接口
虚拟MAC地址
集群管理
网络配置管理
协议