一种基于FPGA的共享DSP卷积神经网络加速器实现方法

AITNT
正文
推荐专利
一种基于FPGA的共享DSP卷积神经网络加速器实现方法
申请号:CN202411891716
申请日期:2024-12-20
公开号:CN119808856A
公开日期:2025-04-11
类型:发明专利
摘要
本发明公开了一种基于FPGA的共享DSP卷积神经网络加速器实现方法,属于FPGA硬件加速领域,包括卷积神经网络训练和量化、数据重排和基于FPGA的共享DSP卷积神经网络加速器设计。其主要思路为:利用数据量化和数据重排减少存储资源和寻址资源的使用;采用深度可动态配置的行缓冲设计,根据不同卷积层的数据流特性和计算需求,动态调整行缓冲的深度,从而避免了传统固定深度缓冲设计中可能出现的存储资源过度分配或不足的问题;采用共享DSP设计,利用单个DSP实现两个有符号整型8位(INT8)乘法,减少乘法资源使用,提高计算效率。
技术关键词
数据 卷积神经网络图像 加速器 卷积神经网络训练 端口 缓冲模块 AXI协议 参数 深度缓冲 内存控制器 符号 移位寄存器 尺寸 通道 动态 文件系统
系统为您推荐了相关专利信息
1
基于动态安全的通讯增强方法及装置
待测系统 参数 通讯 高速数据通道 动态
2
一种基于人工智能拓扑优化的三维结构重建系统
重建系统 子模块 节点分布密度 三维结构 三维点云数据
3
基于大模型与网状网络的智能设备协同管理方法
协同管理方法 贝叶斯神经网络 资源分配 决策算法 个性化教育资源
4
基于分布式约束优化的资源分配方法、装置及电子设备
约束优化模型 实体 业务数据构建 资源分配方法 策略
5
一种抑郁症识别方法、装置和人形机器人
矩阵 双边滤波器 识别方法 多模态 知识图谱构建
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号