摘要
本公开涉及一种数据处理方法、处理器、芯片、显卡及电子设备,涉及智能计算领域,所述方法包括:响应于张量计算引擎簇中M个张量计算引擎完成从所属计算单元的局部存储器或寄存器中读取部分第一矩阵,以及从张量存储器中读取第二矩阵,M个张量计算引擎分别根据部分第一矩阵和第二矩阵执行矩阵运算,得到自身对应的运算结果;M个张量计算引擎分别将自身对应的运算结果写入自身的寄存器。本公开实施例可在不增加计算单元内部的局部存储器和寄存器的大小和带宽的情况下增加算力。
技术关键词
矩阵运算指令
存储器
同步计数器
数据处理方法
算术逻辑单元
执行矩阵乘运算
显卡
分发模块
处理器
电子设备
芯片
信号
元素
标记
阵列
系统为您推荐了相关专利信息
动态障碍物
垃圾机器人
垃圾方法
生成机器人
网络接口
栅极电极
导电沟槽
插塞结构
集成电路结构
纳米线
数据预测方法
客户端
服务器
数据预测装置
传播算法
布隆过滤器
信息查询方法
索引
信息查询装置
密钥生成算法