三维堆叠存算一体化移动人工智能加速系统及推理方法

AITNT
正文
推荐专利
三维堆叠存算一体化移动人工智能加速系统及推理方法
申请号:CN202511348880
申请日期:2025-09-19
公开号:CN120996203A
公开日期:2025-11-21
类型:发明专利
摘要
本申请涉及三维堆叠存算一体化人工智能加速系统及推理方法,包括:三维堆叠存储模块,其包括多个通过高密度垂直互连结构进行通信的垂直堆叠的DRAM层;计算单元阵列,其通过三维集成技术与三维堆叠存储模块的至少一层进行直接通信耦合,并被配置为执行大型语言模型或多模态大型语言模型的至少部分推理计算;以及预存储键值缓存管理模块,该模块被配置为:在三维堆叠存储模块的一个或多个指定物理区域内,预先存储有由预定义的系统提示词经预填充计算后生成的键值缓存;计算单元阵列被进一步配置为:在执行所述推理计算时,访问预存储的键值缓存,并将其与根据动态用户输入生成的数据相结合,从而避免对系统提示词进行重复的预填充计算。
技术关键词
加速系统 键值 存储模块 推理方法 三维集成技术 模板 垂直互连结构 非暂时性计算机可读存储介质 动态 阵列 注意力机制 加载控制器 增量更新 高密度 索引表 核心 数据通信 矩阵
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号