大语言模型运算装置、大语言模型加速装置及大语言模型运算方法

正文

推荐专利

申请号：CN202510164374

申请日期：2025-02-13

公开号：CN119990215A

公开日期：2025-05-13

类型：发明专利

摘要

本公开提供了一种大语言模型运算装置、大语言模型加速装置及大语言模型运算方法，该大语言模型运算装置包括多个第一计算单元以及至少一个第二计算单元，各个第一计算单元能够独立同步执行大语言模型的目标网络层的部分运算，无需采用图形处理器完成大语言模型所需的大规模运算，实现了利用成本较低的各个计算单元替代昂贵的图形处理器完成大语言模型的解码计算，有效降低大语言模型的解码成本和计算压力，并且每个第一计算单元存储的矩阵数据的数据量相同，这样各个第一计算单元基于存储的矩阵数据进行运算时的运算速度相似，使得第二计算单元无需耗费较长时间特别等待某个第一计算单元的反馈，从而有助于减少延迟，提升大语言模型整体运行效率。

技术关键词

大语言模型运算装置通信接口存储单元矩阵加速装置数据广播阶段图形处理器整体运行效率注意力芯片数据存储解码算法板卡级联压力

系统为您推荐了相关专利信息

基于目标函数在线优化的PMSM角速度控制方法及装置

同步电机角速度控制方法鲁棒控制预测机械估计误差

一种应用于机电设备运维的模型集群链系统

算法模型运维管理平台集群数据采集模块楼宇机电设备

基于槽间关系学习的对话状态跟踪方法及系统

对话状态跟踪方法深度学习网络模型编码器主题聚类

一种基于Transformer-LSTM的晶圆沉积膜厚预测方法

注意力机制流量控制器加热器序列子系统

基于检索增强生成的电力行业问题处理方法及装置

大语言模型语句答案文本聚类

大语言模型运算装置、大语言模型加速装置及大语言模型运算方法

站点导航

APP 下载