摘要
本发明实施例公开了一种支持矩阵乘和矩阵Reduce类算子的处理器及运算方法;处理器包括由多个计算单元构成的脉动阵列,支持多种矩阵浮点计算,包括矩阵乘、矩阵Reduce类算子计算及矢量MAX/MIN求值计算。本发明通过定义特别的三操作数浮点计算基础单元,配合灵活的操作数分配和调度能够支持矩阵乘、多种矩阵Reduce算子以及矢量的最大值/最小值求解,最大程度上应用了矩阵计算单元的运算能力。此外,本发明通过阵列化的方式实现计算基础单元阵列,在优化和定制该计算基础单元的情况下,能够获得最大的能耗比。且,本发明所提供的技术方案可应用于AI芯片、NPU设计及矩阵运算单元等。
技术关键词
矩阵
浮点数
处理器
基础
数值
元素
级联方式
周期
阵列
能耗
芯片
定义
系统为您推荐了相关专利信息
关节
李雅普诺夫理论
时间控制方法
误差
控制力矩
隧道变形预测方法
多源监测数据
数值模拟方法
隧道变形预测技术
数值计算方法
智能检测算法
区块链存证
存储历史信息
生成哈希值
LSTM模型