一种面向分布式模型训练的网内多跳梯度汇聚方法

AITNT
正文
推荐专利
一种面向分布式模型训练的网内多跳梯度汇聚方法
申请号:CN202410874961
申请日期:2024-07-02
公开号:CN118863014A
公开日期:2024-10-29
类型:发明专利
摘要
本发明公开了一种面向分布式模型训练的网内多跳梯度汇聚方法,该方法由控制器根据网络状态计算分布式模型训练的网内多跳梯度汇聚结构,并根据所计算的网内多跳梯度汇聚结构标记各训练节点所发送的梯度分片,利用可编程交换机可以灵活解析数据包的特点,在梯度分片经过可编程交换机时,通过多个可编程交换机协作执行梯度分片在数据中心网络内的多次汇聚与转发,从而大量缩减模型梯度通信所产生的网络流量,同时增加了分布式模型训练的吞吐量,加速了模型训练。
技术关键词
可编程交换机 服务器节点 分片 分布式模型 汇聚方法 标记 内存 训练系统 网络 控制器 数据中心 代表
系统为您推荐了相关专利信息
1
一种适应多情景降水的外排受限城乡圩区多策略协同治涝方法
情景 多策略融合 受限 移动泵站 联合调度方法
2
用于元宇宙电商平台的区块链加密和深度学习检索的方法
动态资源调度算法 零知识证明协议 商品特征 同态加密技术 电商
3
多链路移动互联通信中的隐私保护方法
移动路由器 移动互联通信 隐私保护方法 分片 SM4算法
4
一种基于区块链的云数据分布式存储方法及系统
检索标签 数据分析模型 分布式存储网络 实时数据 策略
5
一种基于云平台的分布式医学影像数据存储方法
分片 云平台 站点 联合损失函数 标识符
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号