摘要
本发明公开了一种多GPU平台上的利用矩阵稀疏性加速卷积神经网络方法,该方法包括如下步骤:确定数据规模F和GPU数量G,启动MGPUSim内核;将输入数据从MGPUSim的全局内存加载到多级缓存;输入数据进行非零值的掩码遍历,通过GPU并行得到掩码图集合;通过掩码图进行卷积计算,忽略零值数据输入,从而减少计算;如果卷积层后有池化层,则完成后续池化层计算;完成剩余层的计算并将结果输出到全局内存。本发明的目的在于提供一种多GPU平台上的利用矩阵稀疏性加速卷积神经网络方法,旨在解决目前基于CPU或单GPU平台上稀疏矩阵在卷积神经网络卷积层计算中计算效率不高,卷积神经网络计算整体时间较长的现状。通过增加掩码以去除零值计算从而减少计算量然后从结果掩码倒推输入数据位置的方法忽略稀疏矩阵中0值对于卷积层计算的影响,同时在形成掩码图集合、卷积层计算、池化层计算等步骤均使用多GPU并行提升卷积神经网络整体的计算效率。
技术关键词
卷积神经网络方法
多GPU平台
GPU并行
滑动窗口
矩阵
神经网络卷积层
输出特征
坐标
内存
数据
元素
内核
规模
索引
线性
图像
系统为您推荐了相关专利信息
光伏电站集群
混合预测模型
节点特征
天气
空间特征提取
土壤介电常数
随机森林模型
样本
微波遥感技术
盐分
LSTM模型
股票数据处理
序列
爬虫程序
股票预测方法
定位轨迹数据
地图匹配方法
粒子
地图匹配算法
轨道