摘要
本发明涉及神经网络设计领域,公开了一种分体式编码张量计算架构及应用,该架构具体包括张量计算单元微架构模块和集中式编码器模块,其中,集中式编码器模块用于对被乘数进行编码,并将编码结果广播或脉动到整个张量计算单元微架构模块中,张量计算单元微架构模块用于接收编码结果,并执行乘法操作中的部分积压缩和累加以生成最终乘法运算结果。本发明解决了传统AI加速器中编码器冗余和数据流复杂的问题,显著提升了面积效率和能效,尤其适用于深度学习推理、边缘计算和高性能计算场景,有着切实意义上的实用价值。
技术关键词
编码器模块
系统级芯片
数值
执行乘法
控制器模块
算数逻辑单元
执行矩阵乘法
存储单元
神经网络推理
符号
表达式
存储模块
多项式
神经网络模型
编码算法
全加器
数据编码