基于存算一体的大语言模型推理装置、推理系统及电子设备

AITNT
正文
推荐专利
基于存算一体的大语言模型推理装置、推理系统及电子设备
申请号:CN202423133115
申请日期:2024-12-18
公开号:CN223486536U
公开日期:2025-10-28
类型:实用新型专利
摘要
本实用新型公开一种基于存算一体的大语言模型推理装置、推理系统及电子设备,推理装置包括:至少用于存储的存储层;至少用于计算的计算层,计算层通过混合键合的方式与存储层堆叠设置;计算层包括基于存算一体的神经网络加速器,神经网络加速器包括存内计算矩阵,存内计算矩阵用于将输入特征数据和来自存储层的权重进行神经网络计算;计算层还用于与控制推理装置的主控芯片电连接,计算层还用于进行大语言模型推理的预填充处理且将预填充处理后的数据传输至主控芯片进行大语言模型推理的解码处理,以使得预填充处理和解码处理分离。本发明提供的推理装置支持高带宽,其算力大,功耗低,还能解决现存的LLM推理装置的散热问题。
技术关键词
推理装置 神经网络加速器 大语言模型 DRAM存储器 逻辑运算单元 推理系统 主控芯片 读出电路 存储阵列 SRAM存储器 乘法器 数据 解码 矩阵 电子设备 输入端 信号 高带宽 输出端 功耗
系统为您推荐了相关专利信息
1
基于大语言模型的企业知识检索方法、系统、设备及介质
知识检索方法 大语言模型 查询意图 企业 检索策略
2
问题回答方法、装置、设备、系统及程序产品
大语言模型 知识点 聚类 数据 服务端
3
一种低代码平台中MCP生成与调用方法、装置、设备及介质
低代码平台 自然语言 仓库 业务场景构建 语义分析技术
4
基于大语言模型方法的企业人工智能发展水平测度方法
大语言模型 BERT模型 企业 矩阵分类模型 爬虫技术
5
基于多模态大语言模型的目标识别及定位方法、装置及产品
大语言模型 多模态 编码特征 定位方法 坐标
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号