大语言模型加速器

正文

推荐专利

大语言模型加速器

申请号：CN202410943035

申请日期：2024-07-15

公开号：CN119025468B

公开日期：2025-04-25

类型：发明专利

摘要

本发明涉及人工智能硬件平台中智能集成电路、智能芯片、AI芯片；人工智能通用技术中深度神经网络、多层神经网络、卷积神经网络等领域，尤其涉及一种大语言模型加速器。本发明大语言模型运算节点包括：至少1个计算单元和第一存储单元，两者位于同一设计架构内，其中：计算单元，用于进行计算；第一存储单元，用于驻留大语言模型运算过程中的静态权重数据；第二存储单元，设置于设计结构的外部，用于存储大语言模型运算过程中KV cache数据。本发明有效避免了传统外存静态权重数据读取所带来的高功耗和高延迟问题，相比于传统的HBM方案，本发明在性能功耗和成本上均具有明显优势。

技术关键词

存储单元大语言模型加速器集群节点矩阵切片动态智能集成电路接口处理单元板卡并行作业数据存储深度神经网络对话系统智能芯片硬件平台

系统为您推荐了相关专利信息

一种多机器人协调合作系统的最优调度搜索方法

搜索方法 Petri网模型资源库演化规则 Dijkstra算法

一种工业互联网的区块链多节点安全通信方法

网络仿真工具任务调度节点负载均衡策略工业互联网

预测非模式生物必需基因的数据处理装置及方法与应用

蛋白互作网络分类器模型数据处理装置生物物种基因

一种飞机浮框结构有限元建模方法、应力计算方法及相关装置

有限元建模方法结构有限元模型蒙皮应力计算方法机身结构

一种光伏组件的健康程度诊断方法

程度诊断方法老化模型指标光伏组件参数节点

大语言模型加速器

站点导航

APP 下载