基于3D并行与分布式参数服务器的异步训练方法、装置及存储介质

AITNT
正文
推荐专利
基于3D并行与分布式参数服务器的异步训练方法、装置及存储介质
申请号:CN202510207798
申请日期:2025-02-25
公开号:CN120278212A
公开日期:2025-07-08
类型:发明专利
摘要
本发明涉及一种基于3D并行与分布式参数服务器的异步训练方法、装置及存储介质。该方法中参数服务器节点的训练流程包括:S101,初始化全局模型权重,全局模型权重分布于多个参数服务器节点上;S102,接收当前的本地模型权重,本地模型权重的初始化通过预选的3D并行训练方法实现,本地模型权重的更新通过各个训练任务执行预设时间长度的本地训练实现;S103,基于本地模型权重,更新当前的全局模型权重;S104,将全局模型权重下发至训练任务,并返回S102。与现有技术相比,本发明具有提高分布式模型训练对于异构设备集群的适用性,同时保证在处理万卡级别集群时的训练效率与稳定性等优点。
技术关键词
分布式参数服务器 服务器节点 并行训练方法 两阶段提交协议 分布式模型 集群 异构设备 策略更新 训练装置 程序 存储器 处理器 脚本
系统为您推荐了相关专利信息
1
智能网联商用车车队协同换道系统及优化方法
分布式模型预测控制 换道系统 智能网 采集单元 数据获取模块
2
复杂网络的入侵检测方法及相关装置
网络入侵检测模型 网络流量数据 客户端 入侵检测方法 云数据中心
3
一种基于云边协同的动态任务安全受理方法及系统
服务器节点 消息 模糊推理系统 算法 数据保护
4
一种基于非线性充电函数的电动汽车动态补电路径优化方法和系统
地磁指纹 路径优化方法 温度漂移补偿 分布式模型 云端服务器
5
一种隐私数据多级链路加密传输系统
加密传输系统 链路 客户端 生成密钥 加密数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号