一种面向大规模分布式训练的深度学习模型优化方法

AITNT
正文
推荐专利
一种面向大规模分布式训练的深度学习模型优化方法
申请号:CN202410717237
申请日期:2024-06-04
公开号:CN118535340A
公开日期:2024-08-23
类型:发明专利
摘要
本申请公开了一种面向大规模分布式训练的深度学习模型优化方法。本方法首先输入训练样本数据,计算当前分布式训练系统中各计算节点的资源差异值,根据差异值大小选择数据划分模式;然后将模型结构将划分为多个专家模型,然后在各计算节点上部署对应的专家模型,并结合精度控制和转换模块动态调整各训练阶段的浮点数精度;最后对各计算节点的深度学习模型参数进行参数计算,并将各参数按照从大到小的顺序进行降序排序,根据梯度优先原则,依次从大到小更新对应的模型参数。本申请将梯度通讯和反向传播计算混合并行,提升了模型训练中计算和网络通信的效率,有效降低了大规模分布式训练对计算资源和存储空间的需求。
技术关键词
深度学习模型优化 分布式训练系统 训练样本数据 节点 浮点数 数据划分策略 模式 精度 数据并行处理 阶段 参数更新模块 资源 动态 计算机程序产品 处理器
系统为您推荐了相关专利信息
1
一种基于子图特征重构与多模态融合的相似事件分析方法
事件分析方法 图谱 节点 广度优先搜索 嵌入特征
2
一种基于自监督学习的通信网络故障快速定位与恢复方法
通信网络拓扑 恢复方法 神经网络模型 节点特征 样本
3
一种智能电力调度优化方法及系统
调度优化方法 电网拓扑结构 冗余度 负荷 节点
4
一种增强三元组嵌入的知识图谱补全方法、装置及介质
知识图谱补全方法 三元组 样本 邻域 关系
5
基于VR交互的货物包装与标识远程核对装置
交互模型 VR交互 核对装置 VR虚拟现实 货物包装
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号