摘要
本申请公开了一种分布式训练方法、装置、设备及存储介质,涉及人工智能技术领域。包括:计算节点读取训练数据并结合当前模型参数生成局部梯度,将局部梯度和发送时的时间戳发送至中心聚合服务器;服务器接收来自各计算节点的局部梯度和发送时的时间戳;在接收局部梯度的计算节点数量大于预设聚合阈值的情况下,计算各计算节点的权重并进行梯度聚合,得到全局梯度;基于全局梯度,计算目标学习率和目标模型参数;将目标学习率和目标模型参数分别发送至各计算节点;节点接收目标学习率和目标模型参数进行迭代更新。通过采用异步通信机制,并考虑各节点的实际性能,提出一种能对各节点灵活调整、训练效率更高,提升资源利用率的分布式训练方法。
技术关键词
分布式训练方法
节点
参数
异步通信机制
服务器
人工智能技术
数据
处理器
指标
可读存储介质
存储器
电子设备
时间段
计算机
资源
系统为您推荐了相关专利信息
滑动时间窗口
环形缓冲区
进程监控方法
基板管理控制器
内核
模型预测控制器
构建无人机
无人机自主飞行系统
动态
节点
参数寻优方法
空气盒子
二次特征
聚对苯二甲酸乙二醇
回波