摘要
本发明提供一种基于ZYNQ架构的深度学习算法专用ASIC实现方法,属于深度学习领域技术领域,涉及深度学习领域,包括:根据通用神经网络模块,在FPGA端设计通用IP模块;配置ARM端状态机,用于处理和调度FPGA端硬件专用IP模块;通用处理器解析神经网络配置信息以及权值数据,并将神经网络配置信息传输给ARM端缓存模块;FPGA端通过AXI_Lite读取PS端指令要求执行规定操作,以及通过AXI_DMA读取相关权重,并存储进对应缓存模块;FPGA端根据ARM端指令,进行卷积,池化等操作,ARM端读取FPGA端中断信号值判断卷积状态,发送后续指令,并将最终的生成结果回送到ARM端保存以便后续处理。
技术关键词
ZYNQ架构
深度学习算法
状态机
神经网络硬件加速
数据
模块
构造集成电路
浮点数
查找表
多通道
指令
嵌入式设备
上采样
神经网络模型
网络特征
参数
因子
网络结构
信号值
乘法器
系统为您推荐了相关专利信息
运维知识图谱
多模态数据分析
专家系统
局部波动特征
意图
视频生成方法
图像生成器
视频生成模型
人类
解码器
模拟人系统
包扎材料
外伤
姿态检测模块
图像数据处理单元
识别算法
Delaunay三角剖分
实景三维模型
公差
构建不规则三角网
决策树模型
诊断方法
故障预测模型
案例知识库
车辆