大规模分布式深度学习训练优化方法及其系统

正文

推荐专利

申请号：CN202510790179

申请日期：2025-06-13

公开号：CN120633777A

公开日期：2025-09-12

类型：发明专利

摘要

本发明涉及人工智能和分布式计算技术领域，特别是涉及大规模分布式深度学习训练优化方法及其系统，包括：采用双阈值稀疏梯度压缩算法，根据梯度分布特性动态调节梯度压缩率；构建参数重要性矩阵，识别关键参数子集，其中参数重要性基于历史更新轨迹；采用异构内存分配器，将梯度更新划分为关键子集与普通子集，基于计算能力与内存情况动态分配；执行参数异步更新策略，关键子集同步更新，普通子集异步更新；配置分层参数服务器，基于网络拓扑感知分配网络通信负载。通过双阈值稀疏梯度压缩算法动态调节压缩率，减少65%‑75%的通信开销，同时保持模型收敛精度。

技术关键词

分布式深度学习内存分配器训练优化方法参数压缩算法网络通信负载系统运行效率服务器策略分布式计算技术 NUMA架构检测异常状态物理存储位置因子动态网络拓扑信息异构指数

系统为您推荐了相关专利信息

一种用于污水处理的水质变化监测系统

多参数传感器实时数据数据采集频率监测模块污水处理工艺

微藻养殖用光生物反应器的数据监测控制方法及系统

光生物反应器数据监测控制方法微藻阶段参数

一种金属零件表面复杂微小缺陷视觉检测方法

缺陷视觉检测方法金属零件表面网络检测模型特征金字塔网络注意力

咖啡机电子秤的称量补偿方法、系统、介质及程序产品

盛装容器咖啡机水量电子秤液体

一种积分混合趋近律与灰狼算法优化的PMSM控制方法及系统

灰狼算法滑模观测器静止坐标系数学模型电信号

大规模分布式深度学习训练优化方法及其系统

站点导航

APP 下载