摘要
本公开提供了一种在矢量运算单元中执行卷积运算的方法、计算设备、计算机可读存储介质和计算机程序产品。该方法包括:将所述卷积运算的第一矩阵加载至线程本地寄存器;将所述卷积运算的第二矩阵经由所述线程本地寄存器加载至所述矢量运算单元的线程束标量寄存器;通过乘加指令对从所述线程本地寄存器读取的所述第一矩阵的一个子矩阵的两个元素和从所述线程束标量寄存器读取的所述第二矩阵的两个对应元素进行乘加以获得所述乘加指令的结果;以及将所述乘加指令的结果与从所述线程本地寄存器读取的所述子矩阵的第三元素和从所述线程束标量寄存器读取的所述第二矩阵的第三对应元素的乘积相加以获得所述卷积运算的结果矩阵的一个元素。
技术关键词
矩阵
执行卷积运算
元素
计算机程序产品
计算机程序代码
指令
神经网络模型
可读存储介质
浮点数
通道
数据
关断