一种基于全量和增量推理开销合并的多队列调度方法

正文

推荐专利

申请号：CN202510339900

申请日期：2025-03-21

公开号：CN120216140A

公开日期：2025-06-27

类型：发明专利

摘要

本发明公开了一种基于全量和增量推理开销合并的多队列调度方法，包括如下步骤：首先，在推理任务进行全量推理过程中，根据输入长度和预测器模型大小计算任务的总资源需求和内存开销；根据所述总资源需求，结合响应时间要求和任务重要性，将任务分配到不同优先级的队列中；按照优先级队列顺序动态调度任务，结合系统负载调整执行顺序，优先执行高优先级队列中的任务；为每个任务分配时间片，监控任务执行时间，超时任务被降低优先级并移入次优先级队列，触发新任务调度；在抢占调度后，将等待队列中最晚调度任务的键值缓存从加速器内存换出至CPU内存，并在任务重新执行前换回加速器内存。

技术关键词

队列调度方法内存加速器任务调度算法时间片资源抢占式调度计算方法定义方法表达式键值动态参数

系统为您推荐了相关专利信息

一种基于内存算力感知的模型剪枝方法、设备及介质

人工智能模型模型剪枝方法内存多模型精度

一种多工位微波炉智能烹饪组合控制方法及系统

组合控制方法相互作用模型微波炉组合控制系统资源依赖关系

一种基于静态分析的缓存组件指针分析方法

指针分析方法动态指针键值对存储结构内存泄漏检测传播算法

在区块链系统中进行共识的方法和区块链节点

区块链系统节点拜占庭容错共识算法内存标识

一种硬件预取系统

预取系统检查单元预取模块计数器扫描单元

一种基于全量和增量推理开销合并的多队列调度方法

站点导航

APP 下载