摘要
本申请涉及资源调度管理技术领域,尤其涉及一种基于真实负载的GPU调度方法、系统、设备及存储介质,方法包括获取GPU服务器上的设备总量信息并将其注册到Kubernetes集群;响应于业务容器的GPU资源调度请求,Kubernetes调度器获取每个节点的GPU服务器上的当前用量,选择实时余量最大的节点,将业务容器与所选中节点下的GPU服务器上的所有GPU设备进行绑定;启动业务容器,业务容器发出GPU设备调度请求,基于GPU设备调度请求的类型以及绑定的GPU设备的实时余量为业务容器分配GPU设备。本申请有效解决了现有GPU调度方式在面对资源需求动态变化时缺乏适应性的问题。
技术关键词
PCIE设备
GPU服务器
容器
调度器
节点
资源调度管理技术
物理拓扑结构
集群
总量
调度系统
拦截器
程序
处理器
操作系统
可读存储介质
存储器
电子设备
模块
系统为您推荐了相关专利信息
存储设备
参数
环境监测设备
工业物联网
网络平台
轨迹规划方法
生成无人机
模型预测控制框架
节点
无人机飞行轨迹
检测预警方法
语义
检测预警系统
节点特征
多尺度结构
节点
DBSCAN算法
生成无线网络
分簇方法
近邻算法