摘要
本发明属于大数据领域,具体涉及一种基于NOA‑LightGBM混合算法的低成本Spark任务调度方法,该方法包括:建立Spark作业的成本模型,以提高集群资源利用率和最小化Spark集群的使用成本为目标函数;采用星鸦优化算法(NOA)对LightGBM算法的超参数组合进行优化,确定LightGBM超参数的最优组合;将获得的最优参数组合作为LightGBM算法的超参数,训练预测模型,用预测模型求得Spark应用在运行过程中可能产生掉队者的节点;结合节点性能,对所有节点进行优先级排序,根据节点优先级进行Spark任务调度;本发明提高了集群资源利用率,降低了集群的使用成本,改善了原生Spark任务调度策略存在的问题。
技术关键词
任务调度方法
混合算法
节点
集群资源利用率
低成本
训练预测模型
虚拟机垃圾回收
任务调度策略
样本
构建决策树
超参数
执行器
变量
速度
大数据
系统为您推荐了相关专利信息
城市动态交通
容量优化模型
充电站规划
节点
预测误差
超高层钢结构
预警方法
集成控制模块
三维仿真模型
路径规划算法