摘要
本发明公开了一种NPU分时复用的实时推理系统和调度方法,属于边缘智能计算技术领域,解决了现有技术中传统的边缘智能计算服务设备和推理调度方法难以保证多推理任务推理实时性的问题;本发明在预处理阶段通过准备态预分割器对智能推理模型进行转换,即:结合单位粒度将智能推理模型划分为不同粒度的分块,并获取模型及其分块的运行属性信息;在执行阶段通过运行时规划器接收远程过程调用的任务请求,再通过非线性优化确定最优调度粒度,并根据低切分的NPU实时调度算法生成相应任务调度序列,通过运行时执行器根据作业序列获取任务需要的模型分块并进行执行。本发明有效提高了多任务场景下边缘智能推理计算任务分时复用NPU资源的实时性。
技术关键词
智能模型
分块
时间片
调度算法
推理系统
分割器
异构计算系统
执行器
CPU模块
周期
分支
搬运单元
智能计算技术
队列
DDR存储器
规划
任务调度器
仓库
非线性
系统为您推荐了相关专利信息
参数优化方法
粒子
排序模型
分区
航天器姿态控制
人工智能模型
人机交互方法
多模态会话
摘要
指令
管理方法
人工智能系统
人工智能模型训练
分析患者信息
数据整合技术
协作卸载方法
噪声功率谱密度
速率
网络拓扑变化
场景