一种基于AVX指令的卷积加速方法、设备及介质

正文

推荐专利

申请号：CN202510460031

申请日期：2025-04-14

公开号：CN120494018A

公开日期：2025-08-15

类型：发明专利

摘要

本发明提供一种基于AVX指令的卷积加速方法、设备及介质，属于高性能计算神经网络算子库领域，利用切分输入和权重，将计算等效为若干个步长为1的卷积之和，从而使得WinoGrad算法可以使用加速卷积，并对其改进算法提升算法适用范围，同时利用x86‑CPU的AVX2指令实现优化该算法。一方面该方法可覆盖更多的图像处理模型相关的卷积类型算子性能加速，降低计算延时同时也能充分利用CPU‑GPU异构计算系统中的计算资源；另一方面该方法也为GPU的卷积加速提供新思路和借鉴。

技术关键词

卷积加速方法数据格式可执行程序代码异构计算系统图像处理模型加速装置矩阵指令算法存储器处理器模块可读存储介质高性能缓冲电子设备计算机

系统为您推荐了相关专利信息

工程图纸相似搜索的方法和装置

工程图纸图像处理模型文本命名实体识别模型像素点

一种文件密级标记的智能判定方法及系统

智能判定方法算法资源库判定系统标记

基于大模型的零售行业商品推荐方法、装置、设备及介质

商品零售平台商品推荐方法商品推荐列表异常数据处理方法数据画像

基于智能体的金融风险决策方法、装置、设备及存储介质

决策方法多源异构数据数据融合算法特征提取算法策略

文生图场景下的模型训练方法、装置、设备及介质

文本模型训练方法图文编辑样本

一种基于AVX指令的卷积加速方法、设备及介质

站点导航

APP 下载