摘要
本发明公开了一种多资源混跑的云原生弹性GPU虚拟化方法、系统及其存储介质,涉及GPU虚拟化技术领域,包括对GPU计算资源进行细粒度时间片切分,对运行时间与显存使用量超出分配规格的Pod进行干预处理,根据使用场景动态调整选择设计的GPU算力调度策略,同时利用容器SLA保障机制来感知业务容器健康程度和GPU负载情况,本发明通过既考虑成本又很好地与云原生生态相结合,让GPU算力在支持服务化、算力灵活调度、有效利用率多方面做到最优,通过将AI任务的执行环境抽象出来,提供特定算力和显存规格的虚拟GPU产品,每个运行在虚拟GPU卡上的业务都认为自己是独占整卡资源。
技术关键词
GPU虚拟化方法
时间片
资源
GPU虚拟化技术
容器
钩子
存储计算机程序
动态
周期
策略
节点
任务调度
内核态
模式
处理器
可读存储介质
子系统
系统为您推荐了相关专利信息
并行执行方法
集群
资源分配策略
多组件
深度强化学习模型
建筑作业方法
建筑三维模型
多机器人协同
动态障碍物
强化学习模型
配置QoS策略
QoS配置
IO虚拟化技术
资源
通知