一种面向分布式训练的残差显存优化方法和系统

正文

推荐专利

申请号：CN202510826366

申请日期：2025-06-19

公开号：CN120671746A

公开日期：2025-09-19

类型：发明专利

摘要

本申请属于计算机存储技术领域，具体公开了一种面向分布式训练的残差显存优化方法和系统，该方法包括：获取压缩通信的分布式深度神经网络DNN模型训练中原始梯度与压缩梯度的差值作为残差；将DNN模型划分为可重用组和特定层，所述可重用组中包含结构相同的多个相邻残差层，所述特定层为不包含在可重用组中的层；基于所述可重用组中的平均残差，对所述可重用组中的残差进行缩减，并对所述特定层的残差进行维度压缩；基于缩减后的残差和维度压缩后的残差，更新DNN模型的参数。该方法可以降低分布式训练的显存开销。

技术关键词

分布式训练 DNN模型分布式深度神经网络计算机存储技术计算机程序产品处理器可读存储介质存储计算机程序参数存储器模块电子设备内存

系统为您推荐了相关专利信息

数据脱敏方法、装置、设备及存储介质

数据加密数据脱敏方法字符数据脱敏装置数据获取单元

机器人的并联踝关节的位姿确定方法、装置、设备和产品

雅可比矩阵编码器表达式电机误差

一种可靠性驱动的重复数据删除存储优化方法

存储优化方法边缘控制器副本服务器 LSTM模型

一种基于证书的后量子加密迁移系统、方法、设备及介质

发送方接收方非对称加密算法量子加密算法生成对称密钥

电动汽车充电负荷预测方法、装置和电子设备

充电负荷模型充电负荷预测方法 CatBoost算法数据样本

一种面向分布式训练的残差显存优化方法和系统

站点导航

APP 下载