摘要
本发明公开了一种基于MRAM‑SRAM的异构Chiplet混合精度Transformer加速系统,本发明采用了Chiplet分块集成技术,充分发挥其高良率、低成本的模块化优势,内部集成了两类MRAM计算Chiplet和SRAM‑NPU计算Chiplet异构计算核心及两类调度管理Chiplet和数据交互Chiplet控制单元。在Transformer计算过程中,MRAM计算Chiplet进行自注意力机制中的近似token关系预测,SRAM‑NPU计算Chiplet利用SRAM的高速读写特性和NPU的灵活计算能力实现精确注意力计算,同时由调度管理Chiplet协调计算任务分配,数据交互Chiplet确保高效的数据流动;该加速系统通过Chiplet异构集成技术实现了不同工艺节点器件的最优组合,结合MRAM的高密度低功耗存算一体优势和SRAM‑NPU的高精度计算,以平衡计算效率、能耗和精度三个维度。
技术关键词
加速系统
磁性随机存取存储器阵列
神经网络处理器阵列
静态随机存取存储器
精度
配置管理单元
任务调度器
异构集成技术
重构单元
性能监控
分配系统资源
注意力机制
资源管理器
硅中介层
分析器
数据
控制器
隧道结构
系统为您推荐了相关专利信息
高精度定位系统
SLAM地图
车辆
地图特征
GPS接收机