一种面向大规模分布式训练的深度学习模型优化方法

正文

推荐专利

申请号：CN202410717237

申请日期：2024-06-04

公开号：CN118535340A

公开日期：2024-08-23

类型：发明专利

摘要

本申请公开了一种面向大规模分布式训练的深度学习模型优化方法。本方法首先输入训练样本数据，计算当前分布式训练系统中各计算节点的资源差异值，根据差异值大小选择数据划分模式；然后将模型结构将划分为多个专家模型，然后在各计算节点上部署对应的专家模型，并结合精度控制和转换模块动态调整各训练阶段的浮点数精度；最后对各计算节点的深度学习模型参数进行参数计算，并将各参数按照从大到小的顺序进行降序排序，根据梯度优先原则，依次从大到小更新对应的模型参数。本申请将梯度通讯和反向传播计算混合并行，提升了模型训练中计算和网络通信的效率，有效降低了大规模分布式训练对计算资源和存储空间的需求。

技术关键词

深度学习模型优化分布式训练系统训练样本数据节点浮点数数据划分策略模式精度数据并行处理阶段参数更新模块资源动态计算机程序产品处理器

系统为您推荐了相关专利信息

一种基于子图特征重构与多模态融合的相似事件分析方法

事件分析方法图谱节点广度优先搜索嵌入特征

一种基于自监督学习的通信网络故障快速定位与恢复方法

通信网络拓扑恢复方法神经网络模型节点特征样本

一种智能电力调度优化方法及系统

调度优化方法电网拓扑结构冗余度负荷节点

一种增强三元组嵌入的知识图谱补全方法、装置及介质

知识图谱补全方法三元组样本邻域关系

基于VR交互的货物包装与标识远程核对装置

交互模型 VR交互核对装置 VR虚拟现实货物包装

一种面向大规模分布式训练的深度学习模型优化方法

站点导航

APP 下载