摘要
本发明提供一种Tensor Core加速的混合精度代数多重网格解法器实现方法及系统,该方法包括:在AMG解法器设置阶段,对需要参与SpGEMM算法计算的矩阵进行格式转换,得到格式转换后的矩阵,并使用Tensor Core进行SpGEMM计算;在AMG解法器求解阶段,对所述格式转换后的矩阵进行Tensor Core上的SpMV操作完成光滑和限制操作,得到求解结果。本发明实现了一种新的AMG解法器,能够利用最新GPU中的Tensor Core以及其在混合精度上的计算能力,从而提高AMG解法器的性能和计算效率。
技术关键词
代数多重网格
格式
矩阵
精度
非暂态计算机可读存储介质
算法
阶段
处理器
计算机程序产品
存储器
电子设备
模块
参数
系统为您推荐了相关专利信息
互补金属氧化物半导体传感器
反馈控制信号
事件流
图像
监测方法
序列预测方法
掩码技术
多层堆叠结构
掩码矩阵
模块
动态时间规整
多层卷积神经网络
特征融合网络
分类网络
谐振