摘要
本申请公开了一种基于Kubernetes的GPU任务执行方法、装置、设备及介质,涉及GPU虚拟化技术领域,包括:基于Kubernetes集群中的预设调度扩展器确定目标GPU任务的GPU资源需求信息,并评估Kubernetes集群中各GPU节点的资源负载;利用目标负载预测模型预测目标GPU任务的任务负载曲线,基于任务负载曲线生成目标GPU任务的目标时间片策略指令;基于任务负载曲线、GPU资源需求信息和各GPU节点的资源负载确定目标GPU节点;确定目标GPU节点中的目标虚拟GPU单元,并利用目标虚拟GPU单元,基于目标时间片策略指令执行目标GPU任务。本申请可以实现GPU资源高效共享与精细化分配。
技术关键词
时间片
长短期记忆模型
节点
扩展器
曲线
策略
GPU虚拟化技术
指令
资源管理机制
进程
集群
存储计算机程序
执行装置
电子设备
核心
处理器
插件
队列
系统为您推荐了相关专利信息
资源动态调度方法
移动储能单元
数字孪生体
电力设备信息
生成智能
协调优化控制方法
鲸鱼优化算法
群体智能优化
优化调度模型
源荷协调
无级调节机构
反击式破碎机
破碎总成
机器学习模型
控制模块