摘要
本发明属于深度神经网络技术领域,公开了一种针对多芯粒的存内计算数模混合DNN加速器的优化方法,包括:步骤1、模型预处理:对进行计算的DNN模型进行预处理,根据多芯粒的存内计算数模混合DNN加速器中的数字芯粒和存内运算芯粒确认深度神经网络DNN模型每一层的计算方式;步骤2、任务图谱的构建与优化:根据计算资源和存储资源的资源约束,将DNN模型的任务负载划分为计算和存储任务,构成任务图谱;步骤3、将步骤2构成的任务图谱转换为实际运算的执行图谱,并对执行图谱进行优化。本发明可以有效减少单个推理的延迟,同时提高整体运算的吞吐量,减少整体通信量,减少片上网络拥塞,提高运算性能。
技术关键词
图谱
加速器
集成芯片
多芯
数据依赖关系
通信量
数据传输延迟
模拟退火算法
深度神经网络技术
动态随机存取存储器
链路
资源
节点
规划
流水线
系统为您推荐了相关专利信息
政务数据共享系统
数据安全
法律知识图谱
语义
高风险
命名实体识别方法
实体识别模型
非物质文化遗产
命名实体识别系统
双向长短期记忆网络