摘要
本发明公开及一种适用于ARMv8多核架构的Winograd卷积优化方法及系统,属于深度学习技术领域。所述方法包括:确定tile分块值Tblk、输入通道分块值Cblk和输出通道分块值Kblk,并依据所述tile分块值Tblk划分输入数据,得到tile分块;通过双层嵌套循环完成滤波器的整体域转换,并将整体域转换结果按第一矩阵乘法数据布局存储到FilterOut数组;按tile分块值Tblk遍历tile分块,对每一tile分块执行块内输入转换、耦合的矩阵乘法和输出转换后,得到Winograd卷积优化结果。本发明可以大幅提高Winograd算法的计算效率。
技术关键词
Winograd卷积
分块
矩阵
Winograd算法
卷积优化方法
卷积神经网络模型
通道
滤波器
数据
布局
元素
因子
参数
线程池技术
深度学习技术
队列
浮点数
代表
图像
快照
系统为您推荐了相关专利信息
图像类别
擦除方法
预训练模型
残差矩阵
保留特征
MLP神经网络
多模态信息融合
分支
神经网络分类器
辐射源特征