基于Tensor Core的对角稀疏矩阵-向量乘积求解方法

AITNT
正文
推荐专利
基于Tensor Core的对角稀疏矩阵-向量乘积求解方法
申请号:CN202510256022
申请日期:2025-03-05
公开号:CN120296294A
公开日期:2025-07-11
类型:发明专利
摘要
本发明公开一种基于Tensor Core的对角稀疏矩阵‑向量乘积求解方法,属于专用硬件加速器技术领域。所述方法包括:获取BDIA格式的稀疏矩阵;其中,该BDIA格式的稀疏矩阵由对角稀疏矩阵转换得到;准备输入向量与输出向量,并将输入向量、输出向量、BDIA格式的稀疏矩阵转移到GPU全局内存;设置CUDA内核的启动配置;确定每个warp在输出向量中行区段之后,对输入向量和BDIA格式的稀疏矩阵执行划分,得到向量块和矩阵块;通过warp内协作,将矩阵块和所述向量块从全局内存加载对角块到Tensor Core寄存器;每个warp利用Tensor Core寄存器执行矩阵‑向量乘法,得到该warp对应的最终向量结果;将每个warp对应的最终向量结果写入输出向量。本发明可以减少存储和传输量,提升运算速度和能效。
技术关键词
矩阵 格式 计算机程序指令 GCN模型 节点特征 分块 专用硬件加速器 内存 生成训练数据 可读存储介质 内核 精度 电子设备 处理器 网络 能效 存储器
系统为您推荐了相关专利信息
1
一种基于BRIDG模型的跨标准数据交换方法及系统
语义图谱 数据交换方法 规则集 语义标签 概念
2
飞行器结构损伤的动态概率特征二维构建及在线成像方法
飞行器结构损伤 高斯混合模型 基准 传感 信号
3
零碳园区评价方法和系统
基础数据模型 评价指标体系 零碳 决策分析方法 评价方法
4
一种基于压力传感器的压疮检测方法和系统
压力传感器 特征值 多层次 随机森林模型 矩阵
5
一种水电工程可视化施工进度计划编制系统及方法
计划编制系统 水电工程施工 BIM模型文件 校验模块 施工机械
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号