基于存算一体的大语言模型推理装置、推理系统及电子设备

正文

推荐专利

申请号：CN202411873249

申请日期：2024-12-18

公开号：CN119337953B

公开日期：2025-06-13

类型：发明专利

摘要

本发明公开一种基于存算一体的大语言模型推理装置、推理系统及电子设备，推理装置包括：至少用于存储的存储层；至少用于计算的计算层，计算层通过混合键合的方式与存储层堆叠设置；计算层包括基于存算一体的神经网络加速器，神经网络加速器包括存内计算矩阵，存内计算矩阵用于将输入特征数据和来自存储层的权重进行神经网络计算；计算层还用于与控制推理装置的主控芯片电连接，计算层还用于进行大语言模型推理的预填充处理且将预填充处理后的数据传输至主控芯片进行大语言模型推理的解码处理，以使得预填充处理和解码处理分离。本发明提供的推理装置支持高带宽，其算力大，功耗低，还能解决现存的LLM推理装置的散热问题。

技术关键词

推理装置神经网络加速器大语言模型逻辑运算单元推理系统主控芯片 DRAM存储器读出电路存储阵列 SRAM存储器乘法器数据解码矩阵电子设备输入端信号高带宽输出端功耗

系统为您推荐了相关专利信息

一种实况图片生成方法、装置、电子设备及介质

实况图片大语言模型终端音频消息

基于多维数据融合的论文审查方法及设备

论文文本交互注意力变量自然语言

基于大语言模型的法律辅助方法

案件关键词大语言模型事件主体场景

一种基于人工智能技术的智能相册系统及交互方法

智能相册系统大语言模型人工智能技术智能终端相册语音

一种基于大语言模型的SRAF图形生成方法及系统

图形生成方法大语言模型布局图案对齐模块图形生成系统

基于存算一体的大语言模型推理装置、推理系统及电子设备

站点导航

APP 下载