一种基于FPGA的共享DSP卷积神经网络加速器实现方法

正文

推荐专利

申请号：CN202411891716

申请日期：2024-12-20

公开号：CN119808856A

公开日期：2025-04-11

类型：发明专利

摘要

本发明公开了一种基于FPGA的共享DSP卷积神经网络加速器实现方法，属于FPGA硬件加速领域，包括卷积神经网络训练和量化、数据重排和基于FPGA的共享DSP卷积神经网络加速器设计。其主要思路为：利用数据量化和数据重排减少存储资源和寻址资源的使用；采用深度可动态配置的行缓冲设计，根据不同卷积层的数据流特性和计算需求，动态调整行缓冲的深度，从而避免了传统固定深度缓冲设计中可能出现的存储资源过度分配或不足的问题；采用共享DSP设计，利用单个DSP实现两个有符号整型8位(INT8)乘法，减少乘法资源使用，提高计算效率。

技术关键词

数据卷积神经网络图像加速器卷积神经网络训练端口缓冲模块 AXI协议参数深度缓冲内存控制器符号移位寄存器尺寸通道动态文件系统

系统为您推荐了相关专利信息

基于动态安全的通讯增强方法及装置

待测系统参数通讯高速数据通道动态

一种基于人工智能拓扑优化的三维结构重建系统

重建系统子模块节点分布密度三维结构三维点云数据

基于大模型与网状网络的智能设备协同管理方法

协同管理方法贝叶斯神经网络资源分配决策算法个性化教育资源

基于分布式约束优化的资源分配方法、装置及电子设备

约束优化模型实体业务数据构建资源分配方法策略

一种抑郁症识别方法、装置和人形机器人

矩阵双边滤波器识别方法多模态知识图谱构建

一种基于FPGA的共享DSP卷积神经网络加速器实现方法

站点导航

APP 下载