分布式训练系统

AITNT
正文
推荐专利
分布式训练系统
申请号:CN202410826688
申请日期:2024-06-25
公开号:CN118585820B
公开日期:2025-07-18
类型:发明专利
摘要
本发明提供一种分布式训练系统,属于人工智能技术领域,所述系统包括:将训练数据集切分为多个数据子集并分发至各计算节点的数据分布模块;将各分桶内各计算节点模型训练时产生的局部梯度融合成第一融合梯度的横向梯度融合模块;接收第一融合梯度,并将对应配置的全局梯度权重配发给每个相关的计算节点,以更新初始梯度权重的全局服务器。本发明在计算节点利用数据子集完成模型训练之后,通过横向梯度融合模块融合各计算节点产生的局部梯度,并将融合后的第一融合梯度统一发送给全局服务器,无需各计算节点各自将其产生的局部梯度发送给全局服务器,避免了频繁通信导致分布式系统通信开销大、训练效率降低的问题。
技术关键词
分布式训练系统 节点 数据分布 服务器 分布式系统通信 模块 标识符 人工智能技术 模式
系统为您推荐了相关专利信息
1
一种基于差分隐私的隐私数据保护方法、装置、设备及介质
隐私数据保护方法 差分隐私 账本 噪声参数 金融
2
一种基于UWB定位的斗轮机控制方法及系统
模拟模型 环境图像信息 粒子群优化算法 神经网络模型 货物位置信息
3
一种基于长文本的检索增强生成方法及系统
文本 生成方法 大语言模型 相似性判断方法 搜索算法
4
云环境下支持隐私保护的图像检索方法及系统
图像特征向量 云服务器 球体 同态加密算法 节点
5
基于本地盘池化的虚拟机构建方法、装置、电子设备及存储介质
虚拟机构建方法 数据处理单元 节点 资源分配模块 中央处理器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号