摘要
本发明公开一种面向位宽量化LSTM神经网络的加速器,所述加速器包括外部动态随机存取存储器、第一I P核和第二I P核,以及一个用于暂存数据的先进先出队列;所述第一I P核由第一数据加载模块、向量矩阵乘法模块、反量化模块和第一数据存储模块构成;所述第二I P核由第二数据加载模块、偏置加法模块、激活函数应用模块、记忆细胞更新模块和第二数据存储模块构成;所述第一I P核与所述第二I P核均采用LSTM门控计算架构,所述门控计算架构由输入门、遗忘门和输出门构成的四个门控计算单元;本发明通过在I P架构层面的并行化解决LSTM网络在推理过程中吞吐量较低的技术问题。
技术关键词
先进先出队列
LSTM神经网络
数据存储模块
IP核
加速器
反量化模块
记忆
协议
矩阵乘法运算
门控电路
参数
分段
存储器