摘要
本申请提供了一种面向异构GPU集群的资源分配与任务调度方法及系统。该方法基于系统当前排队任务数量、运行任务数量以及任务到达率,利用Little定理动态计算系统的平均响应时间,当系统响应时间超过最晚服务时延时,触发基于资源效用的亲和度感知算法与市场化资源调度算法,获得新的资源分配和任务调度方案,实现合理的资源分配与任务调度优化。该申请深入感知模型与硬件的亲和度,充分挖掘不同任务模型在异构GPU上的性能差异。同时,通过引入市场配置机制,建立了基于供需动态平衡的资源分配框架,实现了资源配置效率的优化,在保证任务服务质量的前提下,该方法有效提高了GPU集群整体资源的利用率。
技术关键词
任务调度方法
资源调度算法
共享GPU资源
异构
时延
资源分配框架
矩阵
系统响应时间
集群
任务调度系统
KKT条件
监测模块
动态
多任务
分析模块
拉格朗日
系统为您推荐了相关专利信息
星历信息
通信路径切换方法
通信路径切换装置
遗传算法
综合电子系统
多探头
线缆收纳装置
定位方法
传送机构
采集电路
系统信道估计方法
导频信号
匹配追踪算法
矩阵
接收端
高桩码头结构
损伤识别方法
分布式光纤传感网络
深度学习模型
多源异构数据
神经架构搜索
异构多智能体
轨迹预测方法
轨迹预测模型
轨迹预测系统