分布式训练系统

正文

推荐专利

分布式训练系统

申请号：CN202410826688

申请日期：2024-06-25

公开号：CN118585820B

公开日期：2025-07-18

类型：发明专利

摘要

本发明提供一种分布式训练系统，属于人工智能技术领域，所述系统包括：将训练数据集切分为多个数据子集并分发至各计算节点的数据分布模块；将各分桶内各计算节点模型训练时产生的局部梯度融合成第一融合梯度的横向梯度融合模块；接收第一融合梯度，并将对应配置的全局梯度权重配发给每个相关的计算节点，以更新初始梯度权重的全局服务器。本发明在计算节点利用数据子集完成模型训练之后，通过横向梯度融合模块融合各计算节点产生的局部梯度，并将融合后的第一融合梯度统一发送给全局服务器，无需各计算节点各自将其产生的局部梯度发送给全局服务器，避免了频繁通信导致分布式系统通信开销大、训练效率降低的问题。

技术关键词

分布式训练系统节点数据分布服务器分布式系统通信模块标识符人工智能技术模式

系统为您推荐了相关专利信息

一种基于差分隐私的隐私数据保护方法、装置、设备及介质

隐私数据保护方法差分隐私账本噪声参数金融

一种基于UWB定位的斗轮机控制方法及系统

模拟模型环境图像信息粒子群优化算法神经网络模型货物位置信息

一种基于长文本的检索增强生成方法及系统

文本生成方法大语言模型相似性判断方法搜索算法

云环境下支持隐私保护的图像检索方法及系统

图像特征向量云服务器球体同态加密算法节点

基于本地盘池化的虚拟机构建方法、装置、电子设备及存储介质

虚拟机构建方法数据处理单元节点资源分配模块中央处理器

分布式训练系统

站点导航

APP 下载