一种多资源混跑的云原生弹性GPU虚拟化方法、系统及其存储介质

AITNT
正文
推荐专利
一种多资源混跑的云原生弹性GPU虚拟化方法、系统及其存储介质
申请号:CN202510334680
申请日期:2025-03-20
公开号:CN120276840A
公开日期:2025-07-08
类型:发明专利
摘要
本发明公开了一种多资源混跑的云原生弹性GPU虚拟化方法、系统及其存储介质,涉及GPU虚拟化技术领域,包括对GPU计算资源进行细粒度时间片切分,对运行时间与显存使用量超出分配规格的Pod进行干预处理,根据使用场景动态调整选择设计的GPU算力调度策略,同时利用容器SLA保障机制来感知业务容器健康程度和GPU负载情况,本发明通过既考虑成本又很好地与云原生生态相结合,让GPU算力在支持服务化、算力灵活调度、有效利用率多方面做到最优,通过将AI任务的执行环境抽象出来,提供特定算力和显存规格的虚拟GPU产品,每个运行在虚拟GPU卡上的业务都认为自己是独占整卡资源。
技术关键词
GPU虚拟化方法 时间片 资源 GPU虚拟化技术 容器 钩子 存储计算机程序 动态 周期 策略 节点 任务调度 内核态 模式 处理器 可读存储介质 子系统
系统为您推荐了相关专利信息
1
基于液相芯片的防城茶低咖啡碱相关分子标记及其应用
核苷酸 标记 分子 引物 可可碱
2
一种基于虚拟化的高并发多组件流并行执行方法
并行执行方法 集群 资源分配策略 多组件 深度强化学习模型
3
一种多机器人协同的建筑作业方法及系统
建筑作业方法 建筑三维模型 多机器人协同 动态障碍物 强化学习模型
4
SSD SR-IOV配置QoS策略的方法、装置、设备及介质
配置QoS策略 QoS配置 IO虚拟化技术 资源 通知
5
基于云平台及边缘计算的车辆救援管理方法及系统
边缘计算站 风险 车辆 服务站 云平台
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号