摘要
本发明公开了深度学习硬件加速技术领域的一种基于FPGA的卷积神经网络加速架构,包括:处理器系统PS,用于从外部存储设备读取数据并将数据存储于内存中,通过接口模块与可编程逻辑PL进行数据交互;可编程逻辑PL,包括卷积模块、池化模块和上采样模块,所述可编程逻辑PL通过接口模块接收来自处理器系统PS的数据并执行并行计算;接口模块,用于连接处理器系统PS与可编程逻辑PL,通过时延优化机制,并将可编程逻辑PL中不同模块的逻辑端口分别绑定至独立的总线。本发明提出的基于FPGA的卷积神经网络加速架构,能够有效解决数据传输效率低、计算复杂度高以及模块间协同工作不足的问题。
技术关键词
卷积神经网络加速
处理器系统
接口模块
Winograd卷积
逻辑
执行并行计算
卷积模块
外部存储设备
传输特征
缩放参数
硬件加速技术
执行读写操作
AXI接口
采样模块
端口
数据存储
上采样
系统为您推荐了相关专利信息
深度学习模型
过滤系统
个性化特征
声纹特征
高斯滤波器
晶体管
驱动电源电路
逻辑控制电路
栅极驱动电路
温度反馈电路