摘要
本申请提供一种神经网络训练加速器及加速方法、装置,所述训练加速器包括输入寄存器、处理单元阵列、索引匹配单元以及控制器,处理单元阵列包括沿行列排布的多个处理单元,每个索引匹配单元对应一行处理单元,每个输入寄存器对应一列处理单元,控制器用于配置数据通路,其中,数据通路包括列方向通路以及行方向通路,列方向通路指示权重数据基于一列处理单元的方向传递,行方向通路指示权重数据基于一行处理单元的方向传递,所述处理单元还用于基于有效数据、输入数据以及权重数据执行乘法运算,以输出特征图或梯度数据。所述训练加速器通过并行处理多个输出通道的计算,并通过索引匹配单元可实现较少的额外硬件,以提高计算资源利用率。
技术关键词
处理单元
神经网络训练
加速器
索引
生成切换信号
执行乘法
数值
指针
神经网络加速装置
通道
输出特征
序列
数据更新
控制器
阵列
解码器
有效性
尺寸
系统为您推荐了相关专利信息
轨迹调控方法
轮毂
DBSCAN算法
视觉传感器
机器人手臂
缺陷类别
半导体晶圆缺陷
训练深度学习模型
图像
存储计算机程序
自毁芯片
封装外壳
逻辑判断单元
自毁方法
控制单元