摘要
本发明公开了一种多GPU平台上的SpMV算法的负载均衡和访存优化方法。该方法包括如下步骤:确定SpMV数据集的维度、稀疏度以及GPU数目G;计算工作组的数目groupNum,按工作组数目划分原始的CSR格式数据集并送入对应工作组的共享内存中;确定每个工作组线程数目groupSize,计算每个线程的循环步长;实现SpMV计算,将每个工作组的计算结果存储到全局内存得到最终结果。本发明的目的在于针对SpMV算法在CPU和单GPU平台上,对于CSR格式的访存优化方法较少的现状,利用多GPU结构更多的计算资源和存储能力,提出一种多GPU平台上的稀疏矩阵向量乘(SpMV)算法的负载均衡和访存合并优化方法。
技术关键词
多GPU平台
合并优化方法
稀疏矩阵向量乘
算法
内存
数据
格式
系统为您推荐了相关专利信息
双极化SAR图像
建筑物
角反射器
RANSAC算法
中心线
轨迹相似性度量
电压控制型逆变器
电力设备
风电场风机
电压控制型并网逆变器
混凝土结构表面
裂缝
多源信息融合分析
图像分割算法
驱动无人机
三维冲击记录仪
智能监测系统
传感器技术
加速度
LOF算法