一种面向扩散模型并行训练的通信优化方法

AITNT
正文
推荐专利
一种面向扩散模型并行训练的通信优化方法
申请号:CN202510184882
申请日期:2025-02-19
公开号:CN120110931A
公开日期:2025-06-06
类型:发明专利
摘要
本发明公开了一种面向扩散模型并行训练的通信优化方法,主要解决现有并行训练方法通信占比高、易出现落后者的问题。方案包括:1)获取训练样本集,选用任意一个现有的扩散模型;2)获取扩散模型的损失,进行反向传播计算梯度,更新一阶动量和二阶动量,并对其进行修正;3)判断当前训练步长是否达到设定的全局或节点内通信周期,确定通信组;4)根据通信组和类型计数更新通信类型为FP32或BF16;5)使用AllReduce操作分组同步模型参数,对其进行平均;5)重复上述过程直到模型收敛,得到训练好的模型。本发明能够有效降低通信开销,缓解落后者问题,显著提升并行训练效率,可用于大规模扩散模型的深度学习任务。
技术关键词
全局通信 通信优化方法 节点 参数 并行训练方法 噪声 单精度浮点数 周期 文本编码器 图像编码器 训练样本集 数据 动态 数值 算法 偏差
系统为您推荐了相关专利信息
1
一种基于多任务学习的肿瘤甲基化分型及新亚型发现方法、设备及程序产品
多任务 肿瘤 无限高斯混合模型 输出特征 融合特征
2
一种基于多模态大模型的图表分析方法、架构及终端
图表分析方法 多模态 桥接模块 大语言模型 令牌
3
一种基于多智能体的血红细胞图像识别分类方法
图像识别分类方法 视觉问答模型 图像嵌入 解码器 大语言模型
4
一种电-气综合能源系统分区优化方法及系统
气综合能源系统 分区优化方法 评价指标体系 节点 虚拟网络
5
一种制水厂用水质智能监测系统
水质智能监测系统 生成警报信号 项目 人工智能模型 数据分析模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号