一种面向扩散模型并行训练的通信优化方法

正文

推荐专利

一种面向扩散模型并行训练的通信优化方法

申请号：CN202510184882

申请日期：2025-02-19

公开号：CN120110931A

公开日期：2025-06-06

类型：发明专利

摘要

本发明公开了一种面向扩散模型并行训练的通信优化方法，主要解决现有并行训练方法通信占比高、易出现落后者的问题。方案包括：1)获取训练样本集，选用任意一个现有的扩散模型；2)获取扩散模型的损失，进行反向传播计算梯度，更新一阶动量和二阶动量，并对其进行修正；3)判断当前训练步长是否达到设定的全局或节点内通信周期，确定通信组；4)根据通信组和类型计数更新通信类型为FP32或BF16；5)使用AllReduce操作分组同步模型参数，对其进行平均；5)重复上述过程直到模型收敛，得到训练好的模型。本发明能够有效降低通信开销，缓解落后者问题，显著提升并行训练效率，可用于大规模扩散模型的深度学习任务。

技术关键词

全局通信通信优化方法节点参数并行训练方法噪声单精度浮点数周期文本编码器图像编码器训练样本集数据动态数值算法偏差

系统为您推荐了相关专利信息

一种基于多任务学习的肿瘤甲基化分型及新亚型发现方法、设备及程序产品

多任务肿瘤无限高斯混合模型输出特征融合特征

一种基于多模态大模型的图表分析方法、架构及终端

图表分析方法多模态桥接模块大语言模型令牌

一种基于多智能体的血红细胞图像识别分类方法

图像识别分类方法视觉问答模型图像嵌入解码器大语言模型

一种电-气综合能源系统分区优化方法及系统

气综合能源系统分区优化方法评价指标体系节点虚拟网络

一种制水厂用水质智能监测系统

水质智能监测系统生成警报信号项目人工智能模型数据分析模块

一种面向扩散模型并行训练的通信优化方法

站点导航

APP 下载