摘要
本申请提出一种基于DPU的FPGA硬件加速方法及装置,涉及数据处理技术领域,应用于深度学习处理单元DPU,DPU与现场可编程门阵列FPGA芯片相连,其中,方法包括:获取初始数据,其中,初始数据至少包括目标卷积神经网络的输入数据,目标卷积神经网络用于对初始数据进行数据处理;提取对目标卷积神经网络进行格式转换后的等效指令;基于初始数据和等效指令,对现场可编程门阵列FPGA芯片进行控制,以加速目标卷积神经网络的推理。解决了现有加速器对神经网络加速的限制问题,基于DPU高水平的并行性和能源效率,能够灵活对神经网络推理加速,提高推理速度,提升计算效率。
技术关键词
硬件加速方法
硬件加速装置
FPGA芯片
高级可扩展接口
指令
神经网络推理
时钟管理器
处理单元
全局存储器
格式
处理器
数据处理技术
模式
调度器
模块
加速器
高性能
系统为您推荐了相关专利信息
镜像铣削方法
刀具路径
轮廓模型
过渡环
计算机可读取存储介质
模型训练系统
模型训练方法
大语言模型
电子商务行业
镜像
自动驾驶系统
决策
车辆
生成语音控制指令
驾驶者