基于多GPU多SSD的图神经网络训练加速方法及系统

AITNT
正文
推荐专利
基于多GPU多SSD的图神经网络训练加速方法及系统
申请号:CN202411624147
申请日期:2024-11-14
公开号:CN119129683B
公开日期:2025-02-11
类型:发明专利
摘要
本发明公开了一种基于多GPU多SSD的图神经网络训练加速方法及系统,属于图神经网络训练领域。该方法通过读取服务器的物理架构信息,将CPU、GPU、SSD之间的通信链路关系建模为通信拓扑图,并将GPU拉取数据的链路过程转换为单源单汇点的最大流问题,通过Ford‑Fulkerson增广路算求解最优的访问流量分配方案,再考虑图顶点的访问频率将图顶点分配给当前性能指标最优的存储节点进行存储;最终完成图数据集中所有图顶点的存储后,由服务器执行图神经网络的逐批次训练任务。本发明可极大地提高系统的训练吞吐,满足对于TB级别超大规模图的训练,实现高效、低延迟的多GPU多SSD数据访问。
技术关键词
节点 服务器 通信链路 拓扑图 队列 神经网络训练 顶点特征 计算机电子设备 关系建模 通信带宽 生成列表 频率 存储计算机程序 数据 加速系统 超大规模 处理器 内存
系统为您推荐了相关专利信息
1
一种射频电源使用寿命仿真预测方法、装置、设备及介质
射频电源 仿真预测方法 节点 机器学习模型 参数
2
一种服务器架构及设计方法
服务器架构 电源转换单元 节点 高密连接器 逻辑
3
一种特种设备能效优化方法及系统
特种设备 变频驱动器 能效优化方法 能效优化控制 制动电动机
4
一种面向动态决策的注意力情境表征方法与装置
情境要素 表征方法 注意力 数据 度函数
5
一种电力系统的攻防仿真方法、装置及电子设备
无人机模型 时空轨迹数据 仿真场景 线路 电力系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号