一种多GPU平台上的利用矩阵稀疏性加速卷积神经网络方法

正文

推荐专利

申请号：CN202510775260

申请日期：2025-06-11

公开号：CN120633731A

公开日期：2025-09-12

类型：发明专利

摘要

本发明公开了一种多GPU平台上的利用矩阵稀疏性加速卷积神经网络方法,该方法包括如下步骤：确定数据规模F和GPU数量G，启动MGPUSim内核；将输入数据从MGPUSim的全局内存加载到多级缓存；输入数据进行非零值的掩码遍历，通过GPU并行得到掩码图集合；通过掩码图进行卷积计算，忽略零值数据输入，从而减少计算；如果卷积层后有池化层，则完成后续池化层计算；完成剩余层的计算并将结果输出到全局内存。本发明的目的在于提供一种多GPU平台上的利用矩阵稀疏性加速卷积神经网络方法，旨在解决目前基于CPU或单GPU平台上稀疏矩阵在卷积神经网络卷积层计算中计算效率不高，卷积神经网络计算整体时间较长的现状。通过增加掩码以去除零值计算从而减少计算量然后从结果掩码倒推输入数据位置的方法忽略稀疏矩阵中0值对于卷积层计算的影响，同时在形成掩码图集合、卷积层计算、池化层计算等步骤均使用多GPU并行提升卷积神经网络整体的计算效率。

技术关键词

卷积神经网络方法多GPU平台 GPU并行滑动窗口矩阵神经网络卷积层输出特征坐标内存数据元素内核规模索引线性图像

系统为您推荐了相关专利信息

光伏电站集群功率的混合预测模型构建方法及应用方法

光伏电站集群混合预测模型节点特征天气空间特征提取

一种基于随机森林的通用土壤介电常数预测方法

土壤介电常数随机森林模型样本微波遥感技术盐分

一种针对股票时间序列处理及预测的方法

LSTM模型股票数据处理序列爬虫程序股票预测方法

基于轨道交通5G定位的改进粒子滤波地图匹配方法

定位轨迹数据地图匹配方法粒子地图匹配算法轨道

基于模板的代码生成方法、装置和电子设备

模板融合特征代码生成方法文本编码特征

一种多GPU平台上的利用矩阵稀疏性加速卷积神经网络方法

站点导航

APP 下载