一种基于近存计算架构的大模型编译方法和装置

正文

推荐专利

申请号：CN202510359145

申请日期：2025-03-25

公开号：CN120371308A

公开日期：2025-07-25

类型：发明专利

摘要

本发明公开了一种基于近存计算架构的大模型编译方法和装置，应用于智能设备，智能设备包括部署的单芯片单元，每个芯片单元包含多个tile；所述单芯片单元的编译方法包括：在算子的编译阶段，将大模型拆分的算子权重参数的维度N按芯片单元内tile的数量进行拆分；对算子的输入与输出tensor的shape同时进行约束；将算子的输入张量在各相邻tile之间进行轮询传递；在完成芯片单元内所有tile上的并行计算后，获取每个tile上算子的输出结果；再将所有tile的输出结果沿着tile_num这个维度进行合并；最后通过芯片单元内数据排布规则转换输出；其有益效果是：显著提升算子计算效率，加速大模型的推理过程。

技术关键词

模型编译方法智能设备编译装置分配单元阶段参数逻辑存储单元芯片架构模块数据流水线连续性布局关系冗余动态网络

一种基于近存计算架构的大模型编译方法和装置

站点导航

APP 下载