边缘端大语言模型推理系统

AITNT
正文
推荐专利
边缘端大语言模型推理系统
申请号:CN202510371653
申请日期:2025-03-27
公开号:CN120316038A
公开日期:2025-07-15
类型:发明专利
摘要
本发明公开了一种边缘端大语言模型推理系统,该系统包括主计算芯片、LPDDR互连资源和垂直堆叠封装的存储芯片堆;存储芯片堆包括NAND闪存芯片和DRAM芯片,NAND闪存芯片与DRAM芯片成对且共用LPDDR互连资源;NAND闪存芯片包括基于混合键合的三维互连的闪存芯片裸片和CMOS芯片裸片;闪存芯片裸片上设有闪存阵列;CMOS芯片裸片上设有逻辑块;主计算芯片在大语言模型推理的预填充阶段,从NAND闪存芯片读取模型全连接层的参数矩阵,并从DRAM芯片读取其它参数进行计算;NAND闪存芯片在解码阶段进行全连接层计算。本发明的系统可提升外部传输与内部读取带宽。
技术关键词
NAND闪存芯片 闪存阵列 神经网络处理单元 大语言模型 DRAM芯片 矩阵 阶段 纠错单元 推理系统 存储芯片 内存控制器 三维互连 解码 操作系统 参数 访问权限管理 逻辑 指令
系统为您推荐了相关专利信息
1
一种大模型训练数据合成方法、系统、设备及存储介质
样本 语义向量 BERT模型 大语言模型 预训练语言模型
2
基于大语言模型的事件榜单生成方法及系统、电子设备、存储介质
大语言模型 榜单生成方法 文本 帖子 人物实体
3
文本驱动的视觉内容生成模型的训练方法及装置
视觉 文本 对象 噪声 样本
4
基于多模态融合的宫颈癌MRI图像自动分割方法
图像自动分割方法 令牌 多模态 医学图像分割模型 肿瘤
5
法律意图识别模型的训练方法、识别方法及系统
意图识别模型 树形结构 大语言模型 样本 标识符
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号