摘要
本发明提供了一种神经网络加速器的计算硬件架构,包括:至少一个存储器;近内存张量乘法硬件;通用计算硬件;其中,所述近内存张量乘法硬件通过数据传输通路接收来自所述存储器和通用计算硬件的输入,并执行张量乘法降维计算;所述近内存张量乘法硬件的输出结果通过数据传输通路传输至存储器与通用计算硬件;存储器与通用计算硬件通过数据传输通路进行数据传输。本发明提高了神经网络加速器的通用性问题,缓解了带宽瓶颈。
技术关键词
神经网络加速器
数据传输通路
存储器
电路
接口
内存
数据存储
逻辑
瓶颈
格式
频率
系统为您推荐了相关专利信息
生成三维产品
动画
指令
快照
非暂态计算机可读存储介质
岩屑白光
分类网络
图片分类方法
半监督学习
图片分类系统
ROADM系统
遗传算法
深度学习模型
参数调优方法
功率
资源调度策略
对象
资源调度方法
时间段
资源调度模型