基于分布式数据并行的模型训练方法、模型训练方法以及相关设备

AITNT
正文
推荐专利
基于分布式数据并行的模型训练方法、模型训练方法以及相关设备
申请号:CN202510495536
申请日期:2025-04-18
公开号:CN120336856A
公开日期:2025-07-18
类型:发明专利
摘要
本申请实施例公开了基于分布式数据并行的模型训练方法、模型训练方法以及相关设备,用于提升模型训练效率。在分布式数据并行的场景中,参与训练的每个训练端仅需要同步每轮的加权训练损失,并基于同步获得的加权训练损失调整其上部署的本地模型。其中,每轮的加权训练损失为参与训练的多个训练端相应轮训练损失的加权平均值。此外,若多个训练端共享大模型的至少部分网络层,则各训练端只需要在两处同步:一、和前述场景类似,在多个训练端不共享最后一层网络的情况下,运行最后一层网络的每个实例都需要将前述加权训练损失进行独立的反向传播和参数更新;二、在反向传播进行参数更新时在多个训练端共享的单个实例进行反向回传梯度的聚合平均。
技术关键词
模型训练方法 网络 参数 数据 计算机存储介质 计算机程序产品 中央处理器 存储器 输入输出接口 矩阵 指令 计算机设备 场景
系统为您推荐了相关专利信息
1
一种垃圾邮件的检测方法、系统及终端设备
邮件 分析日志 文本识别 信息检测模块 沙箱检测
2
一种基于大数据的智能化环境监测方法及其系统
环境监测方法 指标 信息熵 环境监测数据 大数据
3
一种新能源场站负荷的动态调度方法
新能源场站 动态调度方法 设备运行状态数据 电网运行参数 负荷
4
一种基于遥感卫星数据的湖泊水库容量测算方法、装置、终端及介质
遥感卫星数据 容量测算方法 水库 遥感影像数据 水体
5
复混肥生产过程的自动化控制系统
自动化控制系统 PLC控制系统 固体流量计 人机交互系统 气动切断阀
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号