大模型投机采样加速架构、数据配置方法及电子芯片

AITNT
正文
推荐专利
大模型投机采样加速架构、数据配置方法及电子芯片
申请号:CN202510533130
申请日期:2025-04-25
公开号:CN120407506A
公开日期:2025-08-01
类型:发明专利
摘要
本发明公开一种大模型投机采样加速架构、数据配置方法及电子芯片,其中,大模型投机采样加速架构,包括:存储器和用于执行投机采样算法的计算模块,存储器和计算模块采用近存计算配置方式;存储器包括多个存储阵列,大模型参数以矩阵切块方式分布式存储在存储阵列中;计算模块包括多个计算子模块,每个计算子模块可直接独立访问对应的存储阵列,计算子模块之间通过片上网络进行通信。本发明可以有效缓解模型参数搬运问题,不仅提升了计算时的带宽,还有效降低了数据传输功耗。
技术关键词
存储阵列 数据配置方法 子模块 电子芯片 令牌 切块 存储计算结果 执行矩阵乘法 共享存储空间 处理单元 访问存储器 参数 序列 网络 算法 非线性
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号