一种基于FPGA的计算顺序优化的高流水度MambaV2硬件加速系统

AITNT
正文
推荐专利
一种基于FPGA的计算顺序优化的高流水度MambaV2硬件加速系统
申请号:CN202411541460
申请日期:2024-10-31
公开号:CN119474003B
公开日期:2025-10-17
类型:发明专利
摘要
本发明公开了一种基于FPGA的计算顺序优化的高流水度MambaV2硬件加速系统,涉及FPGA和机器学习领域,包括:前级模块、张量扩张模块、隐藏层状态计算模块、输出状态计算模块、残差乘归一化模块和输出线性层模块,将MambaV2算法计算过程分为若干个流水级并采用流水形式输出数据流。本发明不改变原有算法结构,而是改变原算法中隐藏层状态方程的运算顺序,提出优化计算顺序的算法,减少运算次数,降低缓存消耗,实现在FPGA上部署推理MambaV2模型,满足边缘场景部署需求,利用FPGA的定制化加速,通过调整数据流,实现整体算法的流水线设计,提高计算资源的利用率,解决数据阻塞问题,降低计算延时和缓存消耗。
技术关键词
硬件加速系统 归一化模块 模型算法 存储单元 表达式 元素 数据 算法结构 流水线 矩阵 单周期 查表法 乘法器 机制 非线性
系统为您推荐了相关专利信息
1
任务执行方法、装置、电子设备和存储介质
数据 队列 执行装置 通道 存储单元
2
一种线缆串扰时受扰线远端串扰电压峰值预测方法
峰值预测方法 径向基函数神经网络 线缆 电压 仿真模型
3
一种实现OFD文档安全存取的碎片化加密方法、装置、设备及介质
加密硬盘 加密方法 会话 密钥管理 解密
4
压缩空气储能压缩机的集成监测方法
压缩空气储能系统 压缩机模型 压缩机出口温度 表达式 压缩机转速
5
一种用于WSN网络的能耗均衡方法、介质及电子设备
网络节点 能耗均衡方法 序列 功耗 平面图
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号