摘要
本发明提供一种基于配置和聚合感知的Spark动态排序优化策略。该方法包括:步骤1:获取待处理任务的任务信息、对应的集群端配置信息和Driver端配置信息;其中,所述任务信息包括任务数据量和任务个数;步骤2:根据任务信息、集群端配置信息和Driver端配置信息分别确定在集群端对待处理任务拟执行排序算子所需的时间Ct以及Driver端拟获取待处理任务的数据传输时间Dt1和在Driver端对待处理任务拟执行排序算子所需的时间Dt2;步骤3:若Dt小于Ct,则将待处理任务直接分配至Driver端执行排序算子;其中,Dt为Dt1和Dt2之和。本发明能够减少集群负担,解决排序算子对数据处理先集群后Driver端导致的资源争用的问题。
技术关键词
集群
LSTM模型
排序算法
策略
动态
数据
内核
负担
阶段
资源
系统为您推荐了相关专利信息
保护切换方法
BIDI光模块
双层电磁屏蔽结构
信号采集装置
柔性导电胶
数据立方体
信号灯
交通特征
交通信号控制器
大数据
网络异常检测
特征聚类分析
异常事件
生成优化建议
网络性能数据