摘要
本发明公开了一种用于浮点神经网络的硬件加速器及其应用方法,本发明的硬件加速器包括权值缓冲、激活值缓冲、部分和缓冲以及由PE组构成的二维空间阵列,PE组包括FP32浮点累加器和共享使用FP32浮点累加器的多个处理单元PE,处理单元PE包括点积单元、低精度累加器、WinFloat解码器、数据分配器、先入先出队列FIFO和浮点数寄存器,低精度累加器的指数位宽和指数偏置可配置以用于处理不同窗口类型的数据。本发明旨在针对浮点神经网络的分级累加提供一种可处理不同窗口类型的数据、芯片面积开销小的用于浮点神经网络的硬件加速器,并针对该硬件加速器提供对应的应用方法以实现窗口浮点格式和窗口选择的优化。
技术关键词
硬件加速器
数据分配器
浮点累加器
指数
浮点数
元素
解码器
变量
加法器
处理单元
交换模块
搜索算法
精度
数据分布
移位器
表达式
队列
缓冲
矩阵
系统为您推荐了相关专利信息
滑动窗口
汽车减震器活塞
缺陷检测方法
像素点
纹理
螺旋内齿圈拉刀
关键结构参数
Kriging模型
螺旋拉刀
模拟退火粒子群算法
变形机器人
运动控制方法
机构滑块
积分滑模
PID控制器
软件版权保护
强化学习模型
语义分析模型
物理
空间分布特征