一种多GPU平台上的利用矩阵稀疏性加速卷积神经网络方法

AITNT
正文
推荐专利
一种多GPU平台上的利用矩阵稀疏性加速卷积神经网络方法
申请号:CN202510775260
申请日期:2025-06-11
公开号:CN120633731A
公开日期:2025-09-12
类型:发明专利
摘要
本发明公开了一种多GPU平台上的利用矩阵稀疏性加速卷积神经网络方法,该方法包括如下步骤:确定数据规模F和GPU数量G,启动MGPUSim内核;将输入数据从MGPUSim的全局内存加载到多级缓存;输入数据进行非零值的掩码遍历,通过GPU并行得到掩码图集合;通过掩码图进行卷积计算,忽略零值数据输入,从而减少计算;如果卷积层后有池化层,则完成后续池化层计算;完成剩余层的计算并将结果输出到全局内存。本发明的目的在于提供一种多GPU平台上的利用矩阵稀疏性加速卷积神经网络方法,旨在解决目前基于CPU或单GPU平台上稀疏矩阵在卷积神经网络卷积层计算中计算效率不高,卷积神经网络计算整体时间较长的现状。通过增加掩码以去除零值计算从而减少计算量然后从结果掩码倒推输入数据位置的方法忽略稀疏矩阵中0值对于卷积层计算的影响,同时在形成掩码图集合、卷积层计算、池化层计算等步骤均使用多GPU并行提升卷积神经网络整体的计算效率。
技术关键词
卷积神经网络方法 多GPU平台 GPU并行 滑动窗口 矩阵 神经网络卷积层 输出特征 坐标 内存 数据 元素 内核 规模 索引 线性 图像
系统为您推荐了相关专利信息
1
光伏电站集群功率的混合预测模型构建方法及应用方法
光伏电站集群 混合预测模型 节点特征 天气 空间特征提取
2
一种基于随机森林的通用土壤介电常数预测方法
土壤介电常数 随机森林模型 样本 微波遥感技术 盐分
3
一种针对股票时间序列处理及预测的方法
LSTM模型 股票数据处理 序列 爬虫程序 股票预测方法
4
基于轨道交通5G定位的改进粒子滤波地图匹配方法
定位轨迹数据 地图匹配方法 粒子 地图匹配算法 轨道
5
基于模板的代码生成方法、装置和电子设备
模板 融合特征 代码生成方法 文本 编码特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号