摘要
本申请公开了一种基于Docker的大数据处理方法、装置、设备及介质,涉及大数据处理技术领域,包括:确定初始Spark镜像,并基于预先编写的Shell脚本确定目标指令文件;利用Docker容器虚拟化技术,基于目标指令文件和初始Spark镜像生成目标Spark镜像;启动目标Spark镜像,并基于目标Spark镜像的集群管理模式启动目标Spark镜像中的Master节点和Worker节点;利用目标Spark镜像中的Master节点和Worker节点,基于预设任务执行触发机制执行相应的大数据计算任务。这样一来,本申请可以提升大数据组件的部署便捷性以及大数据计算任务的管理灵活性。
技术关键词
镜像
容器虚拟化技术
数据处理方法
节点
脚本
自定义网络
机制
命令
集群
大数据处理技术
中央处理器
目录
接口
存储计算机程序
数据处理装置
表达式
电子设备
系统为您推荐了相关专利信息
数据管理系统
新能源车辆
节点
大数据
数字孪生模型
交易并行执行方法
杜鹃搜索算法
萤火虫算法
变量
亮度
优化加速方法
参数
设备架构
智能搜索算法
图形处理器卡
生命周期管理方法
两阶段提交
深度确定性策略梯度
配额
循环箱