一种云环境GPU资源动态调度方法

AITNT
正文
推荐专利
一种云环境GPU资源动态调度方法
申请号:CN202510594377
申请日期:2025-05-09
公开号:CN120104357B
公开日期:2025-07-15
类型:发明专利
摘要
本发明涉及GPU资源动态调度技术领域,具体为一种云环境GPU资源动态调度方法,包括以下步骤:实时监测云环境中各GPU实例的运行指标,采集GPU显存分配记录、GPU显存碎片化程度量值和页面迁移活动计数,通过统计预测任务资源需求总量,生成显存状态评估结果。本发明通过将资源池调整决策与任务匹配度列表联合优化,在实例启动时间参数与释放成本参数的双重约束下筛选实例型号与数量,降低因盲目扩缩容引发的操作延迟与额外成本。基于显存预分配指令与任务进程启动的强绑定机制,结合资源消耗量轨迹的持续追踪,实时反馈显存峰值偏差与执行时间偏差,形成闭环调度优化链路。
技术关键词
资源动态调度方法 资源消耗量 任务调度 执行效能 总量 冗余 列表 动态调度技术 生成资源 任务分配信息 页面 回归预测模型 进程 顺序批量 决策 参数 资源管理器 序列 指令
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号