摘要
本公开提供一种分布式训练方法、装置、计算机设备及存储介质,属于分布式计算技术领域,其可解决现有的分布式训练效率较低的问题。本公开的分布式训练方法包括:对服务器集群中各个计算节点的计算资源类型进行识别,并获取不同类型计算资源的性能特征;对服务器集群中各个计算节点的网络拓扑结构进行感知和建模,并分析各个计算节点之间的网络连接特性;根据不同类型计算节点的性能特征和各个计算节点之间的网络连接特征,利用智能调度算法,生成动态分布式训练任务调度请求;根据动态分布式训练任务调度请求,将训练任务分别分配至相应计算节点进行训练。
技术关键词
分布式训练方法
服务器集群
网络拓扑结构
节点
任务调度
智能调度算法
计算机设备
分布式计算技术
动态
处理器
可读存储介质
模块
存储器
策略
程序
异构
数据
系统为您推荐了相关专利信息
电网仿真调度系统
自定义事件
场景结构
重构
双层优化模型
智能网联汽车
路径生成方法
深度优先搜索算法
多源异构数据融合
图谱
嵌入式软件系统
软件系统架构
功能模块
接口
操作系统管理
在线调度方法
智能仓库
订单管理
布局规则
牵引车