大规模分布式深度学习训练优化方法及其系统

AITNT
正文
推荐专利
大规模分布式深度学习训练优化方法及其系统
申请号:CN202510790179
申请日期:2025-06-13
公开号:CN120633777A
公开日期:2025-09-12
类型:发明专利
摘要
本发明涉及人工智能和分布式计算技术领域,特别是涉及大规模分布式深度学习训练优化方法及其系统,包括:采用双阈值稀疏梯度压缩算法,根据梯度分布特性动态调节梯度压缩率;构建参数重要性矩阵,识别关键参数子集,其中参数重要性基于历史更新轨迹;采用异构内存分配器,将梯度更新划分为关键子集与普通子集,基于计算能力与内存情况动态分配;执行参数异步更新策略,关键子集同步更新,普通子集异步更新;配置分层参数服务器,基于网络拓扑感知分配网络通信负载。通过双阈值稀疏梯度压缩算法动态调节压缩率,减少65%‑75%的通信开销,同时保持模型收敛精度。
技术关键词
分布式深度学习 内存分配器 训练优化方法 参数 压缩算法 网络通信负载 系统运行效率 服务器 策略 分布式计算技术 NUMA架构 检测异常状态 物理存储位置 因子 动态 网络拓扑信息 异构 指数
系统为您推荐了相关专利信息
1
一种用于污水处理的水质变化监测系统
多参数传感器 实时数据 数据采集频率 监测模块 污水处理工艺
2
微藻养殖用光生物反应器的数据监测控制方法及系统
光生物反应器 数据监测控制方法 微藻 阶段 参数
3
一种金属零件表面复杂微小缺陷视觉检测方法
缺陷视觉检测方法 金属零件表面 网络检测模型 特征金字塔网络 注意力
4
咖啡机电子秤的称量补偿方法、系统、介质及程序产品
盛装容器 咖啡机 水量 电子秤 液体
5
一种积分混合趋近律与灰狼算法优化的PMSM控制方法及系统
灰狼算法 滑模观测器 静止坐标系 数学模型 电信号
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号