一种解决大数据系统高并发问题的批次表设计方法

正文

推荐专利

申请号：CN202411680510

申请日期：2024-11-22

公开号：CN119884107A

公开日期：2025-04-25

类型：发明专利

摘要

本发明公开了一种解决大数据系统高并发问题的批次表设计方法。搭建一个高可用的Hadoop集群、Redis双活集群、DolphinScheduler集群、Spark、Hive、Mysql；将每天T+1调度产生的业务数据全量存入Hive表中；同时将这份全量数据以特定的数组格式通过Spark计算存入Redis双活集群，形成一个最新批次；同时将批次信息记录到Mysql；基于Mysql的批次信息复查Redis双活集群；基于Redis双活集群定期清理过期批次数据；基于DolphinScheduler集群调度上述任务。

技术关键词

大数据系统集群阶段任务调度执行高可用机制备份唯一性格式机器人磁盘发动机内存

系统为您推荐了相关专利信息

一种基于位置与知识相似度的软件崩溃错误修复方案推荐方法

调用堆栈推荐方法标记软件网站数据收集

山水画生成方法及其模型获取方法、装置和终端设备

模型获取方法预测特征交互特征生成对抗网络老师

一种基于声纹识别的风机监测方法及系统

风机监测方法声纹特征卷积神经网络模型风险报警策略

数据库迁移验证方法、装置、设备、存储介质及产品

校验算法阶段验证方法数据一致性验证设备存储介质

一种虚拟路由冗余协议的接口实现方法

接口虚拟MAC地址集群管理网络配置管理协议

一种解决大数据系统高并发问题的批次表设计方法

站点导航

APP 下载