摘要
本发明公开了一种基于FPGA的共享DSP卷积神经网络加速器实现方法,属于FPGA硬件加速领域,包括卷积神经网络训练和量化、数据重排和基于FPGA的共享DSP卷积神经网络加速器设计。其主要思路为:利用数据量化和数据重排减少存储资源和寻址资源的使用;采用深度可动态配置的行缓冲设计,根据不同卷积层的数据流特性和计算需求,动态调整行缓冲的深度,从而避免了传统固定深度缓冲设计中可能出现的存储资源过度分配或不足的问题;采用共享DSP设计,利用单个DSP实现两个有符号整型8位(INT8)乘法,减少乘法资源使用,提高计算效率。
技术关键词
数据
卷积神经网络图像
加速器
卷积神经网络训练
端口
缓冲模块
AXI协议
参数
深度缓冲
内存控制器
符号
移位寄存器
尺寸
通道
动态
文件系统
系统为您推荐了相关专利信息
重建系统
子模块
节点分布密度
三维结构
三维点云数据
协同管理方法
贝叶斯神经网络
资源分配
决策算法
个性化教育资源
约束优化模型
实体
业务数据构建
资源分配方法
策略