Tensor Core加速的混合精度代数多重网格解法器实现方法及系统

AITNT
正文
推荐专利
Tensor Core加速的混合精度代数多重网格解法器实现方法及系统
申请号:CN202510476064
申请日期:2025-04-16
公开号:CN120562494A
公开日期:2025-08-29
类型:发明专利
摘要
本发明提供一种Tensor Core加速的混合精度代数多重网格解法器实现方法及系统,该方法包括:在AMG解法器设置阶段,对需要参与SpGEMM算法计算的矩阵进行格式转换,得到格式转换后的矩阵,并使用Tensor Core进行SpGEMM计算;在AMG解法器求解阶段,对所述格式转换后的矩阵进行Tensor Core上的SpMV操作完成光滑和限制操作,得到求解结果。本发明实现了一种新的AMG解法器,能够利用最新GPU中的Tensor Core以及其在混合精度上的计算能力,从而提高AMG解法器的性能和计算效率。
技术关键词
代数多重网格 格式 矩阵 精度 非暂态计算机可读存储介质 算法 阶段 处理器 计算机程序产品 存储器 电子设备 模块 参数
系统为您推荐了相关专利信息
1
一种基于Bezier曲线的机器人G3连续拐角平滑方法
控制点 曲线 平滑方法 机器人 刀轴
2
一种视觉图像的监测方法及电子芯片
互补金属氧化物半导体传感器 反馈控制信号 事件流 图像 监测方法
3
基于Mamba和数据增强的用户点击行为序列预测方法和系统
序列预测方法 掩码技术 多层堆叠结构 掩码矩阵 模块
4
压缩弹簧参数确定方法、装置及设备
藤蔓 参数 重力 融合专家经验 群体智能算法
5
基于多特征融合的小样本雷达目标识别方法
动态时间规整 多层卷积神经网络 特征融合网络 分类网络 谐振
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号