摘要
本发明公开了基于异构GPU集群的尾延迟优化作业调度方法及系统,涉及人工智能技术领域,包括:节点管理器获取各个调度器所生成的初始调度序列,初始调度序列采用短作业优先策略进行任务排序得到的序列;针对出现重尾负载的目标调度器,将对应的初始调度序列升序排列后得到有序序列,据以构建重尾负载任务集合;根据重尾负载任务集合生成所有可能的作业排列方式,以使得作业完成时间最大的调度器的作业完成时间最小为目标,得到最佳作业调度序列;按照最佳作业调度序列将作业分配到各个调度器中进行分布式作业调度;该作业调度方法在混合工作负载下动态选择最优调度策略,保障了严格尾延迟服务级别目标,提升了系统资源利用率与通用性。
技术关键词
优化作业调度
节点管理器
分布式调度器
序列
分布式作业
集群
异构
混合工作负载
系统资源利用率
作业调度方法
任务调度
人工智能技术
策略
索引
参数
动态
系统为您推荐了相关专利信息
电力系统负荷
负荷特征
建立电力系统
调频方法
分解算法
RFID标签
物品尺寸信息
管理方法
运载车
三维模型
渠道
管理系统
纳什均衡博弈
多模态数据采集
数据采集模块