基于自适应梯度稀疏化的加速AI分布式训练方法、系统、设备及介质

正文

推荐专利

申请号：CN202510022097

申请日期：2025-01-07

公开号：CN120124703A

公开日期：2025-06-10

类型：发明专利

摘要

本发明公开了基于自适应梯度稀疏化的加速AI分布式训练方法、系统、设备及介质，方法包括：S1、PS初始化模型参数并发送给所有worker；S2、收到初始化模型参数，worker对DNN完成多次本地训练；S3、分层梯度聚类，采用效率感知梯度稀疏化方法决定是否对该层梯度聚类；采用分层自适应梯度感知方法为需要聚类的层确定聚类数；worker将压缩后的梯度发送给PS；S4、PS对收到的梯度进行解码并梯度聚合，聚合后的梯度用于更新PS上的本地模型参数；S5、PS将更新后的模型参数发送给worker，worker收到最新模型参数后替换原有模型参数并继续新的训练周期；S6、重复S2至S5，直到DNN训练完成。本发明实现加速分布式训练的同时避免模型精度的损失，可用于各种大模型的分布式训练。

技术关键词

分布式训练方法二分查找算法 Kmeans算法稀疏化方法聚类参数分布式训练系统训练深度神经网络数据分布处理器分层 DNN模型服务器计算机设备对象可读存储介质解码存储器

系统为您推荐了相关专利信息

一种海绵道路的渗透性能测试方法及系统

海绵道路渗透性能测试方法压力变化曲线渗透性能测试系统特征值

基于聚类和深度学习模型的电力设备在线故障诊断方法

在线故障诊断方法深度学习模型样本电网电力设备预训练模型

一种环境评价前期准备管理系统

数据采集子系统环境数据采集系统 Huffman编码管理系统分析系统

一种风力发电异常数据分析方法及系统

风力发电数据异常数据分析方法风力发电站指标参数

基于区块链的数字安全管理方法及系统

管理中心服务器语义数据队列序列

基于自适应梯度稀疏化的加速AI分布式训练方法、系统、设备及介质

站点导航

APP 下载