摘要
本发明涉及一种基于分布式FPGA的AI加速卡,属于FPGA硬件加速器装置技术领域。该AI加速卡主控单元使用ZYNQ器件进行可重构设计,计算单元使用FPGA器件,板卡上可集成丰富的内存和外设接口资源。主控单元采用PS+PL结构,在PS中根据算法参数设计指令,PL中搭建硬件电路负责指令译码、控制计算单元和存储管理;计算单元中部署运算电路,执行卷积、池化和上采样等操作。可以采用一片主控单元控制四片计算单元的架构。本发明解决了单片FPGA在部署卷积神经网路模型时资源不足的问题,提高了网络模型在边缘AI设备上的运行效率;模块化和灵活性可以在更复杂的神经网络架构和更广泛的应用场景中实现更高的性能和效率。
技术关键词
主控单元
FPGA加速卡
硬件加速器装置
FPGA芯片
ZYNQ器件
NVME硬盘
卷积神经网路
可重构设计
卷积模块
神经网络架构
UART接口
HDMI接口
DP接口
运算电路
数据总线