摘要
本发明涉及神经网络处理器NPU,具体涉及一种基于深度学习加速核的反卷积运算方法,直接加载输入张量、权重张量和偏置张量至对应的buffer,并排布成所需的结构,使用uop指定参与运算的输入地址、权重地址、偏置地址和输出地址,利用深度学习加速核中卷积运算加速的特点生成反卷积指令,进行反卷积运算;其中,深度学习加速核利用二维卷积过程中,滑动窗口在行方向或列方向上移动步长固定不变的特点,采用四重循环控制二维卷积滑动窗口在二维特征图上的移动,并且使用一条卷积指令即可完成二维卷积运算;本发明提供的技术方案能够有效克服现有技术所存在的反卷积运算效率较低的缺陷。
技术关键词
深度学习加速
卷积运算方法
滑动窗口
处理单元
排布方式
阵列
指令
数据广播
存储器
神经网络处理器
输出特征
通道
元素
内存
参数
模式
索引
尺寸
标识
系统为您推荐了相关专利信息
统计分析方法
分布式数据库集群
海量多源异构
数据治理技术
统计分析模型
数据处理方法
同态加密技术
加密方法
终端设备
服务端
人数识别方法
游乐设备
人体特征识别
图像
视频帧集合
故障状态监测
滑动窗口
元件
决策树剪枝算法
坐标点