摘要
本发明提供了一种面向图神经网络处理器模拟框架的加速方法,通过构建基于GPU的模拟框架,将专用GNN处理器的计算任务分解为多个节点,每个节点对应GPU的一个计算单元;对图神经网络的算子进行重排优化,以在所述模拟框架中优先执行顶点特征变换算子,延后执行边数据分发算子;采用内核融合策略,将多个GPU内核合并为单个内核;基于GNAS编程模型,以边为中心将工作负载划分为线程块,每个线程块并行处理多条边的计算任务,并通过归约和atomicAdd函数操作将结果累积至目标顶点。本发明还提供一种面向图神经网络处理器模拟框架的加速系统、存储介质及电子设备。借此,本发明能够减少冗余计算和内存传输,有效提升专用GNN处理器的模拟效率。
技术关键词
神经网络处理器
顶点特征
内核
融合策略
框架
加速系统
节点
编程
电子设备
处理单元
数据
条目
冗余
内存
索引
存储器
系统为您推荐了相关专利信息
自动生成方法
数据格式
编码规则
报表
系统间数据
落水消声机构
消声装置
降噪系统
伯努利方程
机械钳
敏感信息处理方法
消息
置信度阈值
优化器
引流特征
异构计算方法
算法模型
车机
异构计算框架
资源分配优先级
有限元建模方法
复合材料零件
字典
复合材料结构设计
计算机仿真技术