摘要
本公开提供了一种分布式模型训练优化方法、装置、设备、介质和程序产品,涉及模型训练技术领域。其中,分布式模型训练优化方法包括:选择边缘节点集群中的邻居边缘节点构建分布式训练拓扑;在分布式训练拓扑中执行分布式模型的周期性训练,完成一个训练周期,计算训练得到的模型参数的本地梯度,接收邻居边缘节点发送的邻居压缩梯度,对邻居压缩梯度解压缩得到邻居边缘节点计算训练得到的模型参数的邻居梯度,对本地梯度和邻居梯度进行聚合操作得到聚合梯度,对聚合梯度进行动量补偿,得到补偿梯度,以基于补偿梯度更新模型参数;检测到模型参数满足模型的收敛条件,停止周期性训练。通过本公开的技术方案,有利于减少单次通信的数据量。
技术关键词
训练优化方法
分布式模型
邻居
分布式训练
节点
矩阵
周期性
通信线
模型训练技术
资源状态信息
元素
集群
更新模型参数
缓冲
处理器
列表
计算机程序产品
优化装置
系统为您推荐了相关专利信息
电池健康状态评估
深度置信网络模型
锂离子电池
数据
注意力
运动控制方法
系泊结构
缆绳
姿态控制模块
张紧系统
储能装置
均衡方法
强化学习算法
数学模型
均衡系统
技术趋势预测方法
大语言模型
知识图谱数据
趋势预测系统
时序