摘要
本申请特别涉及一种基于采样的GNN训练方法、装置、设备、介质及程序产品,包括:确定每个计算设备的划分子图;在预设服务器上分别对划分子图进行预采样,根据采样结果得到每个顶点的采样频率,再得到特征缓存文件;将特征缓存文件映射至目标缓存空间,并基于此提取预设数量的顶点特征得到本地特征缓存,再得到划分子图对应的顶点特征;基于此计算每个计算设备的子梯度,并基于预设的梯度聚合函数对子梯度进行聚合得到聚合后的梯度,并发送聚合后的梯度至每个计算设备,使得每个计算设备重新执行得到的每个计算设备的划分子图对应的顶点特征的步骤,直至满足预设结束条件。由此,解决了通信瓶颈导致分布式系统训练GNN时的高延迟等问题。
技术关键词
顶点特征
频率
服务器
划分算法
处理器
分布式系统
计算机程序产品
训练装置
周期
采样模块
邻居
内存
可读存储介质
存储器
标识
电子设备