摘要
本申请公开了一种基于云管理平台的模型训练方法以及云管理平台,可高效地完成模型训练。本申请的方法包括:当租户存在模型训练需求时,租户可向云管理平台发送租户为多个计算节点所设置的模型训练任务。接着,云管理平台可制定这多个计算节点执行模型训练条件所需遵循的训练策略。然后,云管理平台可基于模型训练任务以及训练策略,确定由这多个计算节点构建的多个通信域,以及每个通信域执行模型训练任务产生的通信量。随后,云管理平台可基于这些通信量,对每个通信域的计算节点之间的通信关系进行调整,从而得到调整后的多个通信域。最后,云管理平台可创建调整后的多个通信域,并令调整后的多个通信域完成模型训练任务。
技术关键词
云管理平台
通信域
通信量
节点
通信算法
数据并行策略
模型训练方法
计算机存储介质
计算机程序产品
参数
模块
指令
关系
集群
流水线
物理
系统为您推荐了相关专利信息
能量交易方法
电网系统安全
网络入侵检测模型
区块链技术
网络流量特征
配送路径规划方法
生成配送路径
关联算法
路径规划系统
订单
数据下发方法
分布式哈希表
服务器
客户端
虚拟节点数量