摘要
本申请提供了一种任务的资源调度方法、设备及存储介质,通过预先训练时延预估器,并在深度学习模型运行过程中基于时延预估器预测核函数的运行时延,不仅避免了模型运行过程中预估时延对于GPU时间片的占用,而且加速了运行过程中时延预估的过程。并且根据核函数的运行时延确定核函数的调度优先级,并基于调度优先级对各核函数进行资源调度,实现了核函数级别的资源调度,针对任务请求中不同核函数的资源需求,本申请的方法提升了资源调度的细粒度,并且有效的提升了GPU的资源利用率。
技术关键词
资源分配
时延
资源调度方法
深度学习模型
模型压缩
生成训练数据
机器可读指令
处理器
可读存储介质
电子设备
计算机
参数
系统为您推荐了相关专利信息
滚动轴承故障诊断
GRU神经网络
深度特征提取
搜索算法
位置更新
量化误差
资源分配优先级
网络性能评估
矩阵
特征值
人工智能驱动
动态追踪方法
数值天气预报数据
索引
坐标
图像采集模块
图像编解码方法
运动估计算法
编码策略
调色板编码模式
低秩分解方法
人工智能模型
预训练模型
训练神经网络模型
矩阵