摘要
本发明公开了一种分布式稀疏深度学习模型训练加速方法,应用于以交换机为中间层的分布式深度神经网络训练系统中的交换机,步骤包括:获取工作节点计算的梯度并进行网内聚合,将聚合后的梯度缓存到多层的哈希桶中;将所述哈希桶中溢出的数据识别为热参数并缓存在本地,将所述哈希桶中未溢出的数据识别为冷参数并发往上层交换机,将聚合后的梯度的数据包转发给工作节点和参数服务器。本发明将热参数缓存和梯度聚合任务部署到交换机,通过多层哈希桶结构动态识别和缓存热参数,减少服务器的通信压力和计算负担,提高了缓存效率和存储资源利用率,同时提高了模型训练速度。
技术关键词
深度学习模型训练
分布式深度神经网络
交换机
节点
参数
训练系统
数据
层级
包头
加速系统
服务器
计算机程序产品
中间层
处理器
桶结构
队列
标志
可读存储介质
存储器
负担
系统为您推荐了相关专利信息
可视化预测方法
二值化图像
缺陷类别
边缘检测
X射线图像处理
高温合金紧固件
螺纹检测方法
图像识别模型
螺纹检测系统
边界轮廓
迭代补偿方法
义齿支架
有限元仿真软件
节点
支架模型
超参数
样本
模型训练方法
计算机设备
计算机程序产品