一种基于深度学习加速核的缩放算子计算方法

正文

推荐专利

申请号：CN202510448639

申请日期：2025-04-10

公开号：CN120297345A

公开日期：2025-07-11

类型：发明专利

摘要

本发明涉及神经网络处理器NPU，具体涉及一种基于深度学习加速核的缩放算子计算方法，将输入张量的每个通道的二维特征向量展开成一维特征向量作为矩阵A的行，将输入张量的通道数C作为矩阵A的行数，将输入张量的每个通道的特征数H*W作为矩阵A的列数；根据输入张量的尺寸和输出张量的目标尺寸确定矩阵B的尺寸，将矩阵A的列数H*W作为矩阵B的行数，将输出张量的每个通道的特征数DST_H*DST_W作为矩阵B的列数，矩阵B的列对应输出张量的每个像素点，计算输出张量的每个像素点计算所需的权重，并将计算得到的权重放置于矩阵B的每一列对应位置；本发明提供的技术方案能够克服现有技术所存在的缩放算子计算效率较低的缺陷。

技术关键词

深度学习加速像素点矩阵计算方法滑动窗口处理单元阵列通道数据广播存储器神经网络处理器输出特征尺寸元素指令模式参数

系统为您推荐了相关专利信息

交易控制方法、装置、设备、介质和程序产品

变量机器学习模型交易控制方法连续特征离散特征

一种智能化运维的分布式云原生应用计算方法

分布式云计算方法图谱运维级联故障

一种风机风叶的缺陷确定方法、装置、设备及介质

风机风叶控制无人机跟随纹理特征图像处理算法像素点

确认输入信息的计算方法、可读存储介质及头戴式显示器

关键点计算方法显示虚拟键盘按键头戴式显示器

考虑模态耦合效应的薄壁件多质点多模态铣削稳定性预测方法

铣削稳定性预测方法矩阵状态空间方程铣刀螺旋角多模态

一种基于深度学习加速核的缩放算子计算方法

站点导航

APP 下载