一种适用于ARMv8多核架构的Winograd卷积优化方法及系统

AITNT
正文
推荐专利
一种适用于ARMv8多核架构的Winograd卷积优化方法及系统
申请号:CN202411100814
申请日期:2024-08-12
公开号:CN119106710A
公开日期:2024-12-10
类型:发明专利
摘要
本发明公开及一种适用于ARMv8多核架构的Winograd卷积优化方法及系统,属于深度学习技术领域。所述方法包括:确定tile分块值Tblk、输入通道分块值Cblk和输出通道分块值Kblk,并依据所述tile分块值Tblk划分输入数据,得到tile分块;通过双层嵌套循环完成滤波器的整体域转换,并将整体域转换结果按第一矩阵乘法数据布局存储到FilterOut数组;按tile分块值Tblk遍历tile分块,对每一tile分块执行块内输入转换、耦合的矩阵乘法和输出转换后,得到Winograd卷积优化结果。本发明可以大幅提高Winograd算法的计算效率。
技术关键词
Winograd卷积 分块 矩阵 Winograd算法 卷积优化方法 卷积神经网络模型 通道 滤波器 数据 布局 元素 因子 参数 线程池技术 深度学习技术 队列 浮点数 代表 图像 快照
系统为您推荐了相关专利信息
1
供应链配置方法、设备及产品
产能 事件流 参数 分布式内存 分布式数据库
2
空心电抗器的检测方法、装置、电子设备及计算机程序产品
空心电抗器 采样点 参数 电阻值 序列
3
基于特征正交性的图像风险概念持续擦除方法及系统
图像类别 擦除方法 预训练模型 残差矩阵 保留特征
4
一种基于多模态信息融合的雷达辐射源个体识别方法
MLP神经网络 多模态信息融合 分支 神经网络分类器 辐射源特征
5
一种基于配变差异化运维评估的设备运行调整方法及系统
评估设备 运维 指标 设备运行参数 气象
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号