一种云环境GPU资源动态调度方法

正文

推荐专利

一种云环境GPU资源动态调度方法

申请号：CN202510594377

申请日期：2025-05-09

公开号：CN120104357B

公开日期：2025-07-15

类型：发明专利

摘要

本发明涉及GPU资源动态调度技术领域，具体为一种云环境GPU资源动态调度方法，包括以下步骤：实时监测云环境中各GPU实例的运行指标，采集GPU显存分配记录、GPU显存碎片化程度量值和页面迁移活动计数，通过统计预测任务资源需求总量，生成显存状态评估结果。本发明通过将资源池调整决策与任务匹配度列表联合优化，在实例启动时间参数与释放成本参数的双重约束下筛选实例型号与数量，降低因盲目扩缩容引发的操作延迟与额外成本。基于显存预分配指令与任务进程启动的强绑定机制，结合资源消耗量轨迹的持续追踪，实时反馈显存峰值偏差与执行时间偏差，形成闭环调度优化链路。

技术关键词

资源动态调度方法资源消耗量任务调度执行效能总量冗余列表动态调度技术生成资源任务分配信息页面回归预测模型进程顺序批量决策参数资源管理器序列指令

一种云环境GPU资源动态调度方法

站点导航

APP 下载