摘要
本发明涉及GPU调度技术领域,尤其涉及一种用于资源占用量智能评估的GPU调度系统及方法,该方法包括:在机器学习模型任务的工作流执行至多个设定时长时,均通过Kubernetes的接口获取集群中多个节点的GPU占用资源量;将历史多个GPU占用资源量通过基于线性回归法的用量预测模型计算机器学习模型任务对于集群中多个节点的GPU预测使用量;将多个节点的GPU预测使用量通过基于改进逼近理想解排序法生成最优序列;根据最优序列通过Kubernetes进行节点的GPU优化调度。本发明实现了机器学习模型任务使用GPU资源的高效调度,避免出现GPU资源使用不均衡的问题,提高了机器学习模型任务的资源利用率和性能。
技术关键词
节点
逼近理想解排序
机器学习模型
资源
工作流执行
调度系统
GPU调度技术
集群
序列
计算机
调度算法
线性
模块
插件
内存
接口
参数
系统为您推荐了相关专利信息
海上风电导管架
导管架平台
轻量化设计方法
结构尺寸参数
参数优化模型
运营管理方法
叶面积指数
多层感知器
运营管理系统
模式