一种多资源混跑的云原生弹性GPU虚拟化方法、系统及其存储介质

正文

推荐专利

申请号：CN202510334680

申请日期：2025-03-20

公开号：CN120276840A

公开日期：2025-07-08

类型：发明专利

摘要

本发明公开了一种多资源混跑的云原生弹性GPU虚拟化方法、系统及其存储介质，涉及GPU虚拟化技术领域，包括对GPU计算资源进行细粒度时间片切分，对运行时间与显存使用量超出分配规格的Pod进行干预处理，根据使用场景动态调整选择设计的GPU算力调度策略，同时利用容器SLA保障机制来感知业务容器健康程度和GPU负载情况，本发明通过既考虑成本又很好地与云原生生态相结合，让GPU算力在支持服务化、算力灵活调度、有效利用率多方面做到最优，通过将AI任务的执行环境抽象出来，提供特定算力和显存规格的虚拟GPU产品，每个运行在虚拟GPU卡上的业务都认为自己是独占整卡资源。

技术关键词

GPU虚拟化方法时间片资源 GPU虚拟化技术容器钩子存储计算机程序动态周期策略节点任务调度内核态模式处理器可读存储介质子系统

系统为您推荐了相关专利信息

基于液相芯片的防城茶低咖啡碱相关分子标记及其应用

核苷酸标记分子引物可可碱

一种基于虚拟化的高并发多组件流并行执行方法

并行执行方法集群资源分配策略多组件深度强化学习模型

一种多机器人协同的建筑作业方法及系统

建筑作业方法建筑三维模型多机器人协同动态障碍物强化学习模型

SSD SR-IOV配置QoS策略的方法、装置、设备及介质

配置QoS策略 QoS配置 IO虚拟化技术资源通知

基于云平台及边缘计算的车辆救援管理方法及系统

边缘计算站风险车辆服务站云平台

一种多资源混跑的云原生弹性GPU虚拟化方法、系统及其存储介质

站点导航

APP 下载