基于分布式计算脉动阵列的轻量化LSTM硬件加速器及加速方法

AITNT
正文
推荐专利
基于分布式计算脉动阵列的轻量化LSTM硬件加速器及加速方法
申请号:CN202410997080
申请日期:2024-07-24
公开号:CN118886465A
公开日期:2024-11-01
类型:发明专利
摘要
本发明涉及一种基于分布式计算脉动阵列的轻量化LSTM硬件加速器及加速方法,属于循环神经网络加速器领域。该加速器包括控制模块、重构模块、激活模块和多个脉动阵列,控制模块负责全局调配,尤其是实现在脉动阵列中将权重数据与输入数据耦合相乘;重构模块通过将输入的单个数据缓存并维度重构,使其符合脉动阵列的输入维度;脉动阵列负责实现4个门和全连接层的运算,其中通过脉动的方式传递并计算数据,以减少计算单元的空置率并提高计算效率;本发明在对LSTM网络进行训练时,采用分层分模块轻量化重训练,在使权重参数规模减少的同时保持准确率,本发明提出的LSTM加速器相对于通用处理器具有高能效、高算力的特点。
技术关键词
硬件加速器 重构模块 分布式存储模块 Softmax函数 控制模块 数据 Sigmoid函数 神经网络加速器 定点除法器 参数 周期 记忆 加法器 分段 高能效 线性 乘法器
系统为您推荐了相关专利信息
1
一种超声图像分析方法
图像分析方法 像素点 边缘检测 超声诊断 直方图均衡化
2
基于模糊逻辑控制的面向仿蝠鲼潜水器的多源能源系统
潜水器 太阳能光伏电池板 俘能装置 模糊逻辑控制模块 摩擦发电装置
3
一种基于多模态融合的智能AI矿灯系统及控制方法
矿灯系统 多模态数据采集 智能控制模块 区块链存证 针孔摄像头
4
基于动态规则和深度学习的动态拦截系统及拦截方法
拦截系统 bert模型 动态规则库 关键词 子模块
5
高阻层型液晶透镜驱动系统及方法
液晶透镜 驱动信号 模拟多路复用器 移位寄存器 控制模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号