摘要
本发明公开了一种用于分层网络的分布式训练方法及系统,属于分布式机器学习技术领域,用于解决目前缺乏专为分层网络设计的能够协同优化各层级通信效率,同时保证模型训练精度和稳定性的分布式训练方法,无法满足分层网络通信需求的技术问题。包括:工作节点基于初始模型参数及本地数据,计算局部随机梯度;对局部随机梯度进行量化压缩,得到量化梯度并上传到边缘节点;边缘节点对各个工作节点发送的量化梯度进行聚合,得到聚合梯度并进行误差补偿;对误差补偿后的聚合梯度进行稀疏化压缩处理,得到稀疏化梯度并上传到中央服务器;中央服务器对各个边缘节点发送的稀疏化梯度进行全局聚合,得到全局梯度;根据全局梯度与预设学习率,更新模型参数。
技术关键词
分布式训练方法
节点
分布式训练系统
服务器
分层
分布式机器学习技术
压缩器
压缩处理过程
参数更新模块
更新模型参数
数据
通信效率
计算误差
网络通信
层级
精度
系统为您推荐了相关专利信息
定位组网方法
移动终端
定位组网系统
RSSI信号强度
物理
服务器散热装置
散热控制方法
温度传感器阵列
三维温度场
红外扫描模块
编码向量
时域特征
行波测距方法
配网故障
故障行波采集装置
人脸识别方法
人脸特征向量
四肢
人脸识别设备
人体骨架