一种分布式稀疏深度学习模型训练加速方法

AITNT
正文
推荐专利
一种分布式稀疏深度学习模型训练加速方法
申请号:CN202510478975
申请日期:2025-04-16
公开号:CN120430352A
公开日期:2025-08-05
类型:发明专利
摘要
本发明公开了一种分布式稀疏深度学习模型训练加速方法,应用于以交换机为中间层的分布式深度神经网络训练系统中的交换机,步骤包括:获取工作节点计算的梯度并进行网内聚合,将聚合后的梯度缓存到多层的哈希桶中;将所述哈希桶中溢出的数据识别为热参数并缓存在本地,将所述哈希桶中未溢出的数据识别为冷参数并发往上层交换机,将聚合后的梯度的数据包转发给工作节点和参数服务器。本发明将热参数缓存和梯度聚合任务部署到交换机,通过多层哈希桶结构动态识别和缓存热参数,减少服务器的通信压力和计算负担,提高了缓存效率和存储资源利用率,同时提高了模型训练速度。
技术关键词
深度学习模型训练 分布式深度神经网络 交换机 节点 参数 训练系统 数据 层级 包头 加速系统 服务器 计算机程序产品 中间层 处理器 桶结构 队列 标志 可读存储介质 存储器 负担
系统为您推荐了相关专利信息
1
一种基于X射线的产品缺陷可视化预测方法及装置
可视化预测方法 二值化图像 缺陷类别 边缘检测 X射线图像处理
2
针对高温合金紧固件的螺纹检测方法、系统和设备
高温合金紧固件 螺纹检测方法 图像识别模型 螺纹检测系统 边界轮廓
3
一种基于有限元仿真的义齿支架节点迭代补偿方法
迭代补偿方法 义齿支架 有限元仿真软件 节点 支架模型
4
模型训练方法、装置、计算机设备、可读存储介质和程序产品
超参数 样本 模型训练方法 计算机设备 计算机程序产品
5
一种基于动态尺度选择的实时高效目标检测方法
无人机高度 动态 无人机飞行高度 因子 实时图像
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号