摘要
本发明公开了一种基于分离式架构的分布式训练数据加载方法和装置,属于计算机技术领域,方法包括:远程中心调度器响应本地数据加载客户端发送的请求,收集训练样本的数据元信息并进行负载均衡计算生成数据加载计划和数据消费计划;远程数据加载服务器获取数据加载计划进行数据加载和数据预处理,得到预处理后的分布式训练数据,并预取下一个批次的数据;本地数据加载客户端根据数据消费计划向指定的远程数据加载服务器请求获取预处理后的分布式训练数据并缓存在本地。本发明不仅提升了分布式训练数据加载的效率,还保证了分布式训练中各计算节点的计算负载的均衡性,适用于大规模深度学习模型的分布式训练场景,具有较高的应用价值和推广前景。
技术关键词
分布式训练
数据加载方法
深度学习模型
调度器
计划
客户端
服务器
训练样本数据
数据加载装置
进程
负载均衡算法
存储计算机程序
节点
资源
图片
存储器
处理器
元素
系统为您推荐了相关专利信息
干涉条纹图像
相位解包裹方法
图像生成模型
对齐模块
深度学习模型
混合预测方法
多层感知器
非瞬时性计算机可读存储介质
时间序列模型
拼接模块