摘要
本发明提供一种支持乱序稀疏输出的多模型融合神经网络加速器,包括数据缓存模块存储权重、输入数据及计算参数,通过动态分配器决定将所存储的数据发往空闲计算单元;每个计算单元执行乘累加操作;每个预测模块根据乘累加操作结果预测是否终止后续时间步的计算;在预测模块作用下各个计算单元的结果输出时间不同;串入‑串出寄存器接收并缓存各个计算单元的乘累加操作结果;后处理模块针对所计算神经网络类型从串入‑串出寄存器中提取各个计算单元的乘累加操作结果,输出模块基于异步握手协议将所述后处理模块的处理结果进行输出,结合多种神经网络模型特点,解耦计算单元并输出稀疏预测,将计算单元等待的时间压缩到最短,达到最大硬件利用率。
技术关键词
融合神经网络
后处理模块
加速器
卷积神经网络数据
动态分配器
卷积类神经网络
握手协议
输出模块
脉冲
矩阵乘法运算
神经网络模型
存储结构
多模式
查找表
参数
算法
非线性