摘要
本公开提供了一种用于减少人工智能(AI)系统推理延迟的系统和方法。在运行过程中,系统可以获取AI模型,并对AI模型进行编译,以生成至少一个有向无环图(DAG),包括确定与要从多个AI加速器共享的主存储器传输到辅助存储器的中间数据段相关联的偏移地址。AI加速器、主存储器和辅助存储器位于同一系统级芯片(SoC)上。然后,系统可以调度计算任务,包括确定辅助存储器中关联于DAG的基地址,并基于DAG执行推理,包括根据偏移地址和基地址将中间数据段从主存储器传输到辅助存储器。
技术关键词
加速器
有向无环图
系统级芯片
数据
AI系统
存储器
处理器
任务调度
固件
命令
计算机
指令
系统为您推荐了相关专利信息
组合特征向量
多任务损失函数
粒子群优化算法
深度学习模型
故障隔离
技术支持系统
技术支持方法
人工智能模型
人工智能引擎
意图识别
新能源设备
测评方法
振动信号去噪
综合健康指数
云模型理论
网络准入系统
客票系统
可信计算节点
隐私保险箱
可信密码模块
漏油故障
风力发电机
预警方法
贝叶斯网络模型
油液