摘要
本发明公开了一种面向ARMv8架构的二维三维Winograd卷积优化方法及系统,属于人工智能神经网络计算加速技术领域。本发明为解决Winograd卷积在三维卷积、混合精度、多种滤波器尺寸支持不足,域转换和并行效率低等技术问题,主要采用汇编级微内核设计、数据复用优化、双缓冲GEMM内核和多维并行策略。本发明能够实现不同卷积场景下的高性能计算,显著提升Winograd卷积在ARMv8架构中的运算效率与适应性。
技术关键词
Winograd卷积
数据
人工智能神经网络
矩阵
融合算法
双缓冲机制
布局
卷积滤波器
并行策略
存储计算机程序
通道
批量
分块
内存
网格
存储器
处理器
系统为您推荐了相关专利信息
推荐方法
HSV色彩空间
优化模糊神经网络
模糊神经网络模型
色块
数据交互系统
上行业务数据
完整性保护密钥
功能模块
鉴权参数
无线传感器网络
传感器节点
能耗均衡方法
基站
聚类
识别人脸图像
人脸图像数据
人脸特征向量
随机噪声
身份验证方法