一种NPU分时复用的实时推理系统和调度方法

AITNT
正文
推荐专利
一种NPU分时复用的实时推理系统和调度方法
申请号:CN202411809599
申请日期:2024-12-10
公开号:CN119668811B
公开日期:2025-06-27
类型:发明专利
摘要
本发明公开了一种NPU分时复用的实时推理系统和调度方法,属于边缘智能计算技术领域,解决了现有技术中传统的边缘智能计算服务设备和推理调度方法难以保证多推理任务推理实时性的问题;本发明在预处理阶段通过准备态预分割器对智能推理模型进行转换,即:结合单位粒度将智能推理模型划分为不同粒度的分块,并获取模型及其分块的运行属性信息;在执行阶段通过运行时规划器接收远程过程调用的任务请求,再通过非线性优化确定最优调度粒度,并根据低切分的NPU实时调度算法生成相应任务调度序列,通过运行时执行器根据作业序列获取任务需要的模型分块并进行执行。本发明有效提高了多任务场景下边缘智能推理计算任务分时复用NPU资源的实时性。
技术关键词
智能模型 分块 时间片 调度算法 推理系统 分割器 异构计算系统 执行器 CPU模块 周期 分支 搬运单元 智能计算技术 队列 DDR存储器 规划 任务调度器 仓库 非线性
系统为您推荐了相关专利信息
1
考虑动态分区与排序模型辅助的航天器姿控参数优化方法
参数优化方法 粒子 排序模型 分区 航天器姿态控制
2
基于异步艺术创作的人机交互方法、系统、设备及介质
人工智能模型 人机交互方法 多模态会话 摘要 指令
3
一种基于人工智能的医院管理方法及系统
管理方法 人工智能系统 人工智能模型训练 分析患者信息 数据整合技术
4
一种在高速车联网场景下车车协作卸载方法
协作卸载方法 噪声功率谱密度 速率 网络拓扑变化 场景
5
一种面向任意有向拓扑的电力系统安全低碳经济调度方法
低碳经济 子系统 有功功率 电力系统 调度算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号