基于Tensor Core的对角稀疏矩阵-向量乘积求解方法

正文

推荐专利

申请号：CN202510256022

申请日期：2025-03-05

公开号：CN120296294A

公开日期：2025-07-11

类型：发明专利

摘要

本发明公开一种基于Tensor Core的对角稀疏矩阵‑向量乘积求解方法，属于专用硬件加速器技术领域。所述方法包括：获取BDIA格式的稀疏矩阵；其中，该BDIA格式的稀疏矩阵由对角稀疏矩阵转换得到；准备输入向量与输出向量，并将输入向量、输出向量、BDIA格式的稀疏矩阵转移到GPU全局内存；设置CUDA内核的启动配置；确定每个warp在输出向量中行区段之后，对输入向量和BDIA格式的稀疏矩阵执行划分，得到向量块和矩阵块；通过warp内协作，将矩阵块和所述向量块从全局内存加载对角块到Tensor Core寄存器；每个warp利用Tensor Core寄存器执行矩阵‑向量乘法，得到该warp对应的最终向量结果；将每个warp对应的最终向量结果写入输出向量。本发明可以减少存储和传输量，提升运算速度和能效。

技术关键词

矩阵格式计算机程序指令 GCN模型节点特征分块专用硬件加速器内存生成训练数据可读存储介质内核精度电子设备处理器网络能效存储器

系统为您推荐了相关专利信息

一种基于BRIDG模型的跨标准数据交换方法及系统

语义图谱数据交换方法规则集语义标签概念

飞行器结构损伤的动态概率特征二维构建及在线成像方法

飞行器结构损伤高斯混合模型基准传感信号

零碳园区评价方法和系统

基础数据模型评价指标体系零碳决策分析方法评价方法

一种基于压力传感器的压疮检测方法和系统

压力传感器特征值多层次随机森林模型矩阵

一种水电工程可视化施工进度计划编制系统及方法

计划编制系统水电工程施工 BIM模型文件校验模块施工机械

基于Tensor Core的对角稀疏矩阵-向量乘积求解方法

站点导航

APP 下载