一种Transformer大模型推理硬件加速器架构及其实现方法

正文

推荐专利

申请号：CN202510937566

申请日期：2025-07-08

公开号：CN120832951A

公开日期：2025-10-24

类型：发明专利

摘要

本发明一种Transformer大模型推理硬件加速器架构及其实现方法，采用基于内存优化MoD架构的Transformer推理加速器Reordered MoD，采用算法‑架构协同设计方法：算法层面，通过分布调整前移和路由决策前移技术实现精度恢复，并借助特征向量重排序降低内存访问成本；架构层面，设计层归一化‑路由融合模块和特征向量重排序以及序列记录模块，在提升计算效率的同时控制内存开销；同时开发动态片上存储系统支持层融合技术，大幅减少外部存储器访问。通过软硬件协同优化，Reordered MoD加速器实现了1.61倍的推理加速，外部存储带宽需求降低53.7％，能耗减少62.5％。本发明设计达到9.40TOPS的吞吐量，1224GOPS/mm2的面积效率，以及23.6TOPS/W的能效表现。

技术关键词

硬件加速器架构动态存储系统流水线存储电路网络架构片上存储系统电路模块神经网络加速器协同设计方法模型计算方法硬件描述语言逻辑电路注意力输入输出接口非线性模式

系统为您推荐了相关专利信息

一种员工工时和绩效数据的评估方法、装置及计算机设备

神经网络模型时间序列模型数据随时间稳定工作模式计算机设备

一种飞机客舱内LED照明系统测试台

内LED照明系统测试台飞机客舱通信连接器通信芯片

一种基于U-Net模型的光变曲线数据降噪方法与装置

数据降噪方法曲线动态时间规整方法时序特征上采样

一种电网领域大模型的部署方法及系统

内存深度学习模型深度学习框架硬件设备信息优化器

一种硒鼓加工用取料装置

流水线传送带真空吸盘机械臂送料梁架

一种Transformer大模型推理硬件加速器架构及其实现方法

站点导航

APP 下载