摘要
本发明公开了一种基于Zynq的卷积神经网络硬件加速系统,基于Zynq异构芯片实现,包含PL端模块、PS端模块和存储模块。PL端模块包括卷积加速模块、全连接层加速模块和Softmax激活模块,用于完成卷积计算、全连接运算和激活函数处理;PS端模块包括输入数据处理模块和后处理模块,负责输入数据的加载与预处理以及检测结果的排序和筛选。存储模块由片内存储器和片外存储器构成,其中片内存储器存储输入数据的中间处理结果、卷积核和中间特征图数据;片外存储器存储原始图像数据、全连接层的权重参数和最终检测结果。各模块通过64位AXI总线连接,PS端模块负责协调数据流动,PL端模块执行高效并行计算。本系统充分利用Zynq异构架构的高性能特性,适用于卷积神经网络的高效推理加速场景,特别在嵌入式AI设备中具有广泛的应用前景。
技术关键词
卷积神经网络硬件加速
硬件加速系统
存储模块
查找表存储器
后处理模块
数据处理模块
原始图像数据
高效并行计算
异构
数据传输单元
芯片
矩阵
加载单元
接口单元
逻辑
数据存储
连线
系统为您推荐了相关专利信息
数据分析模块
预警装置
气体浓度传感器
数据采集模块
预警模块
图像检测模型
海上救援方法
拍摄装置
上采样
神经网络结构
人工智能模型
字段
矩阵
硬件加速器
内存访问指令