摘要
本发明涉及一种基于分布式计算脉动阵列的轻量化LSTM硬件加速器及加速方法,属于循环神经网络加速器领域。该加速器包括控制模块、重构模块、激活模块和多个脉动阵列,控制模块负责全局调配,尤其是实现在脉动阵列中将权重数据与输入数据耦合相乘;重构模块通过将输入的单个数据缓存并维度重构,使其符合脉动阵列的输入维度;脉动阵列负责实现4个门和全连接层的运算,其中通过脉动的方式传递并计算数据,以减少计算单元的空置率并提高计算效率;本发明在对LSTM网络进行训练时,采用分层分模块轻量化重训练,在使权重参数规模减少的同时保持准确率,本发明提出的LSTM加速器相对于通用处理器具有高能效、高算力的特点。
技术关键词
硬件加速器
重构模块
分布式存储模块
Softmax函数
控制模块
数据
Sigmoid函数
神经网络加速器
定点除法器
参数
周期
记忆
加法器
分段
高能效
线性
乘法器
系统为您推荐了相关专利信息
图像分析方法
像素点
边缘检测
超声诊断
直方图均衡化
潜水器
太阳能光伏电池板
俘能装置
模糊逻辑控制模块
摩擦发电装置
矿灯系统
多模态数据采集
智能控制模块
区块链存证
针孔摄像头
拦截系统
bert模型
动态规则库
关键词
子模块
液晶透镜
驱动信号
模拟多路复用器
移位寄存器
控制模块