摘要
本申请提供一种智算中心的模型训练方法、装置及相关设备,智算中心的模型训练方法,包括:获取智算中心的模型的历史训练信息和所述智算中心的网络故障率信息;基于所述历史训练信息和所述网络故障率信息确定检查点保存间隔周期;基于所述检查点保存间隔周期训练所述智算中心的模型。这样,由于可以基于智算中心的模型的历史训练信息和智算中心的网络故障率信息灵活的确定检查点保存间隔周期,使得模型训练的资源成本最优,即当基于检查点保存间隔周期训练模型时,可以降低训练时长的开销,从而缩短总训练时长,降低训练成本。
技术关键词
模型训练方法
检查点
参数
图形处理器
神经网络算法
周期
训练数据量
模型训练装置
服务器
计算机程序产品
存储器
光模块
可读存储介质
电子设备
指令
系统为您推荐了相关专利信息
水文参数
数据分析方法
智慧水利
水利模型
水利系统
质心计算方法
卷积神经网络模块
神经网络硬件
数据流控制模块
可编程逻辑单元
虚拟对象
轨迹
车辆
非临时性计算机可读存储介质
速度
电流传感器
粒子群算法
非易失性存储介质
规划
参数
稳定性分析方法
动态数学模型
直流微电网技术
仿真模型
分布式储能系统