摘要
本发明提供一种基于AVX指令的卷积加速方法、设备及介质,属于高性能计算神经网络算子库领域,利用切分输入和权重,将计算等效为若干个步长为1的卷积之和,从而使得WinoGrad算法可以使用加速卷积,并对其改进算法提升算法适用范围,同时利用x86‑CPU的AVX2指令实现优化该算法。一方面该方法可覆盖更多的图像处理模型相关的卷积类型算子性能加速,降低计算延时同时也能充分利用CPU‑GPU异构计算系统中的计算资源;另一方面该方法也为GPU的卷积加速提供新思路和借鉴。
技术关键词
卷积加速方法
数据格式
可执行程序代码
异构计算系统
图像处理模型
加速装置
矩阵
指令
算法
存储器
处理器
模块
可读存储介质
高性能
缓冲
电子设备
计算机
系统为您推荐了相关专利信息
工程图纸
图像处理模型
文本
命名实体识别模型
像素点
商品零售平台
商品推荐方法
商品推荐列表
异常数据处理方法
数据画像
决策方法
多源异构数据
数据融合算法
特征提取算法
策略