摘要
本发明公开一种基于FPGA的VGG‑16卷积加速器设计及部署方法,包括以下步骤:部署方面:量化卷积神经网络模型,在牺牲部分精度的情况下将整个网络的量化为8bit数据类型,缩小到原来网络的1/4大小;根据VGG‑16模型各个卷积层输入特征图大小共同特点,固定卷积加速器的输入大小并通过重复调用卷积加速器,直到当前卷积神经网络计算完成;卷积加速器设计方面:在卷积加速器上增加对卷积加速器上的输入特征图分块并行计算,在卷积过程中实现流水并行方式。本发明为VGG‑16卷积加速器设计的分块策略,提高了卷积加速器单位时间内的计算吞吐量。
技术关键词
卷积加速器
高层次综合工具
输出特征
量化卷积神经网络
分块策略
数据
通道
平铺
误差
图像块
样本
高性能
流水
因子
精度
参数
系统为您推荐了相关专利信息
意图识别方法
特征提取模块
意图识别模型
影像
识别模块
工业设备状态监测
噪声样本
监测方法
波动特征
编码器
多特征协同
输电线路覆冰检测
注意力机制
输出特征
训练神经网络