摘要
本发明公开了一种基于无同步SpTRSV算法的访存与并行效率优化方法,属于高性能并行计算领域,包括:步骤一,根据稀疏矩阵非零元素将行划分为长行和短行;步骤二,将目标向量x的值均设置为最大值;步骤三,将写阶段所需的数据预取到寄存器中;步骤四,在读阶段,判断依赖情况并进行累加操作;步骤五,在写阶段,从寄存器读取数据,计算对应行x的值。本发明解决了目前无同步SpTRSV算法中线程级并行写阶段的线程分歧问题,以及线程级和线程束级粗粒度的选择策略,从而导致GPU利用率不高的问题。
技术关键词
效率优化方法
高性能并行计算
元素
阶段
矩阵
算法
内存
模式
通知
数据
策略
系统为您推荐了相关专利信息
新能源汽车发动机
寻优方法
发电机
BP神经网络
新能源汽车传动系统
水库生态调度方法
水库蓄水量
径流
指标
模糊隶属度
在线优化方法
多面体
噪声数据
包裹技术
计算机设备
阿尔兹海默症诊断
诊断系统
归因
模块
医疗物联网技术