基于分布式数据并行的模型训练方法、模型训练方法以及相关设备

正文

推荐专利

申请号：CN202510495536

申请日期：2025-04-18

公开号：CN120336856A

公开日期：2025-07-18

类型：发明专利

摘要

本申请实施例公开了基于分布式数据并行的模型训练方法、模型训练方法以及相关设备，用于提升模型训练效率。在分布式数据并行的场景中，参与训练的每个训练端仅需要同步每轮的加权训练损失，并基于同步获得的加权训练损失调整其上部署的本地模型。其中，每轮的加权训练损失为参与训练的多个训练端相应轮训练损失的加权平均值。此外，若多个训练端共享大模型的至少部分网络层，则各训练端只需要在两处同步：一、和前述场景类似，在多个训练端不共享最后一层网络的情况下，运行最后一层网络的每个实例都需要将前述加权训练损失进行独立的反向传播和参数更新；二、在反向传播进行参数更新时在多个训练端共享的单个实例进行反向回传梯度的聚合平均。

技术关键词

模型训练方法网络参数数据计算机存储介质计算机程序产品中央处理器存储器输入输出接口矩阵指令计算机设备场景

系统为您推荐了相关专利信息

一种垃圾邮件的检测方法、系统及终端设备

邮件分析日志文本识别信息检测模块沙箱检测

一种基于大数据的智能化环境监测方法及其系统

环境监测方法指标信息熵环境监测数据大数据

一种新能源场站负荷的动态调度方法

新能源场站动态调度方法设备运行状态数据电网运行参数负荷

一种基于遥感卫星数据的湖泊水库容量测算方法、装置、终端及介质

遥感卫星数据容量测算方法水库遥感影像数据水体

复混肥生产过程的自动化控制系统

自动化控制系统 PLC控制系统固体流量计人机交互系统气动切断阀

基于分布式数据并行的模型训练方法、模型训练方法以及相关设备

站点导航

APP 下载