任务的资源调度方法、设备及存储介质

AITNT
正文
推荐专利
任务的资源调度方法、设备及存储介质
申请号:CN202511126249
申请日期:2025-08-12
公开号:CN120950218A
公开日期:2025-11-14
类型:发明专利
摘要
本申请提供了一种任务的资源调度方法、设备及存储介质,通过预先训练时延预估器,并在深度学习模型运行过程中基于时延预估器预测核函数的运行时延,不仅避免了模型运行过程中预估时延对于GPU时间片的占用,而且加速了运行过程中时延预估的过程。并且根据核函数的运行时延确定核函数的调度优先级,并基于调度优先级对各核函数进行资源调度,实现了核函数级别的资源调度,针对任务请求中不同核函数的资源需求,本申请的方法提升了资源调度的细粒度,并且有效的提升了GPU的资源利用率。
技术关键词
资源分配 时延 资源调度方法 深度学习模型 模型压缩 生成训练数据 机器可读指令 处理器 可读存储介质 电子设备 计算机 参数
系统为您推荐了相关专利信息
1
基于改进的VMD优化CNN-GRU神经网络的滚动轴承故障诊断算法
滚动轴承故障诊断 GRU神经网络 深度特征提取 搜索算法 位置更新
2
神经网络的量化压缩与算力自适应优化方法及系统
量化误差 资源分配优先级 网络性能评估 矩阵 特征值
3
一种人工智能驱动的台风路径动态追踪方法及系统
人工智能驱动 动态追踪方法 数值天气预报数据 索引 坐标
4
一种图像采集模块及编解码方法
图像采集模块 图像编解码方法 运动估计算法 编码策略 调色板编码模式
5
基于强化学习的人工智能模型的多分解压缩方法
低秩分解方法 人工智能模型 预训练模型 训练神经网络模型 矩阵
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号