摘要
本发明涉及神经网络处理器NPU,具体涉及一种基于深度学习加速核的缩放算子计算方法,将输入张量的每个通道的二维特征向量展开成一维特征向量作为矩阵A的行,将输入张量的通道数C作为矩阵A的行数,将输入张量的每个通道的特征数H*W作为矩阵A的列数;根据输入张量的尺寸和输出张量的目标尺寸确定矩阵B的尺寸,将矩阵A的列数H*W作为矩阵B的行数,将输出张量的每个通道的特征数DST_H*DST_W作为矩阵B的列数,矩阵B的列对应输出张量的每个像素点,计算输出张量的每个像素点计算所需的权重,并将计算得到的权重放置于矩阵B的每一列对应位置;本发明提供的技术方案能够克服现有技术所存在的缩放算子计算效率较低的缺陷。
技术关键词
深度学习加速
像素点
矩阵
计算方法
滑动窗口
处理单元
阵列
通道
数据广播
存储器
神经网络处理器
输出特征
尺寸
元素
指令
模式
参数
系统为您推荐了相关专利信息
变量
机器学习模型
交易控制方法
连续特征
离散特征
风机风叶
控制无人机跟随
纹理特征
图像处理算法
像素点
关键点
计算方法
显示虚拟键盘
按键
头戴式显示器
铣削稳定性预测方法
矩阵
状态空间方程
铣刀螺旋角
多模态