摘要
本发明公开了一种基于FPGA的计算顺序优化的高流水度MambaV2硬件加速系统,涉及FPGA和机器学习领域,包括:前级模块、张量扩张模块、隐藏层状态计算模块、输出状态计算模块、残差乘归一化模块和输出线性层模块,将MambaV2算法计算过程分为若干个流水级并采用流水形式输出数据流。本发明不改变原有算法结构,而是改变原算法中隐藏层状态方程的运算顺序,提出优化计算顺序的算法,减少运算次数,降低缓存消耗,实现在FPGA上部署推理MambaV2模型,满足边缘场景部署需求,利用FPGA的定制化加速,通过调整数据流,实现整体算法的流水线设计,提高计算资源的利用率,解决数据阻塞问题,降低计算延时和缓存消耗。
技术关键词
硬件加速系统
归一化模块
模型算法
存储单元
表达式
元素
数据
算法结构
流水线
矩阵
单周期
查表法
乘法器
机制
非线性
系统为您推荐了相关专利信息
峰值预测方法
径向基函数神经网络
线缆
电压
仿真模型
压缩空气储能系统
压缩机模型
压缩机出口温度
表达式
压缩机转速