摘要
本发明涉及GPU资源动态调度技术领域,具体为一种云环境GPU资源动态调度方法,包括以下步骤:实时监测云环境中各GPU实例的运行指标,采集GPU显存分配记录、GPU显存碎片化程度量值和页面迁移活动计数,通过统计预测任务资源需求总量,生成显存状态评估结果。本发明通过将资源池调整决策与任务匹配度列表联合优化,在实例启动时间参数与释放成本参数的双重约束下筛选实例型号与数量,降低因盲目扩缩容引发的操作延迟与额外成本。基于显存预分配指令与任务进程启动的强绑定机制,结合资源消耗量轨迹的持续追踪,实时反馈显存峰值偏差与执行时间偏差,形成闭环调度优化链路。
技术关键词
资源动态调度方法
资源消耗量
任务调度
执行效能
总量
冗余
列表
动态调度技术
生成资源
任务分配信息
页面
回归预测模型
进程
顺序批量
决策
参数
资源管理器
序列
指令