一种基于AVX指令的卷积加速方法、设备及介质

AITNT
正文
推荐专利
一种基于AVX指令的卷积加速方法、设备及介质
申请号:CN202510460031
申请日期:2025-04-14
公开号:CN120494018A
公开日期:2025-08-15
类型:发明专利
摘要
本发明提供一种基于AVX指令的卷积加速方法、设备及介质,属于高性能计算神经网络算子库领域,利用切分输入和权重,将计算等效为若干个步长为1的卷积之和,从而使得WinoGrad算法可以使用加速卷积,并对其改进算法提升算法适用范围,同时利用x86‑CPU的AVX2指令实现优化该算法。一方面该方法可覆盖更多的图像处理模型相关的卷积类型算子性能加速,降低计算延时同时也能充分利用CPU‑GPU异构计算系统中的计算资源;另一方面该方法也为GPU的卷积加速提供新思路和借鉴。
技术关键词
卷积加速方法 数据格式 可执行程序代码 异构计算系统 图像处理模型 加速装置 矩阵 指令 算法 存储器 处理器 模块 可读存储介质 高性能 缓冲 电子设备 计算机
系统为您推荐了相关专利信息
1
工程图纸相似搜索的方法和装置
工程图纸 图像处理模型 文本 命名实体识别模型 像素点
2
一种文件密级标记的智能判定方法及系统
智能判定方法 算法 资源库 判定系统 标记
3
基于大模型的零售行业商品推荐方法、装置、设备及介质
商品零售平台 商品推荐方法 商品推荐列表 异常数据处理方法 数据画像
4
基于智能体的金融风险决策方法、装置、设备及存储介质
决策方法 多源异构数据 数据融合算法 特征提取算法 策略
5
文生图场景下的模型训练方法、装置、设备及介质
文本 模型训练方法 图文 编辑 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号