基于多GPU多SSD的图神经网络训练加速方法及系统

正文

推荐专利

申请号：CN202411624147

申请日期：2024-11-14

公开号：CN119129683B

公开日期：2025-02-11

类型：发明专利

摘要

本发明公开了一种基于多GPU多SSD的图神经网络训练加速方法及系统，属于图神经网络训练领域。该方法通过读取服务器的物理架构信息，将CPU、GPU、SSD之间的通信链路关系建模为通信拓扑图，并将GPU拉取数据的链路过程转换为单源单汇点的最大流问题，通过Ford‑Fulkerson增广路算求解最优的访问流量分配方案，再考虑图顶点的访问频率将图顶点分配给当前性能指标最优的存储节点进行存储；最终完成图数据集中所有图顶点的存储后，由服务器执行图神经网络的逐批次训练任务。本发明可极大地提高系统的训练吞吐，满足对于TB级别超大规模图的训练，实现高效、低延迟的多GPU多SSD数据访问。

技术关键词

节点服务器通信链路拓扑图队列神经网络训练顶点特征计算机电子设备关系建模通信带宽生成列表频率存储计算机程序数据加速系统超大规模处理器内存

系统为您推荐了相关专利信息

一种射频电源使用寿命仿真预测方法、装置、设备及介质

射频电源仿真预测方法节点机器学习模型参数

一种服务器架构及设计方法

服务器架构电源转换单元节点高密连接器逻辑

一种特种设备能效优化方法及系统

特种设备变频驱动器能效优化方法能效优化控制制动电动机

一种面向动态决策的注意力情境表征方法与装置

情境要素表征方法注意力数据度函数

一种电力系统的攻防仿真方法、装置及电子设备

无人机模型时空轨迹数据仿真场景线路电力系统

基于多GPU多SSD的图神经网络训练加速方法及系统

站点导航

APP 下载