摘要
本公开涉及一种数据处理方法、处理器、芯片、显卡及电子设备,涉及智能计算领域,所述方法包括:响应于张量计算引擎簇中M个张量计算引擎完成从所属计算单元的局部存储器或寄存器中读取部分第一矩阵,以及从张量存储器中读取第二矩阵,M个张量计算引擎分别根据部分第一矩阵和第二矩阵执行矩阵运算,得到自身对应的运算结果;M个张量计算引擎分别将自身对应的运算结果写入自身的寄存器。本公开实施例可在不增加计算单元内部的局部存储器和寄存器的大小和带宽的情况下增加算力。
技术关键词
矩阵运算指令
存储器
同步计数器
数据处理方法
算术逻辑单元
执行矩阵乘运算
显卡
分发模块
处理器
电子设备
芯片
信号
元素
标记
阵列