摘要
本申请公开了模型训练任务的状态数据保存方法、恢复方法和设备,涉及人工智能计算技术领域,包括一方面,将第一子训练任务的状态数据保存到计算节点的内存中后,在第一子训练任务或第二子训练任务异常时,可以从内存中获取用于任务恢复的状态数据。由于内存的数据传输效率高,因此可以大大提高模型训练任务的恢复效率。另一方面,将第一子训练任务的状态数据在第一计算节点的内存(即本地内存)和第二计算节点的内存中相互备份后,若其中一个计算节点处于异常状态,依然可以从另一个计算节点的内存中获取状态数据,保证任务恢复的时效性和可靠性。综上,本申请的技术方案可以解决相关技术中的模型训练任务的恢复效率低的问题。
技术关键词
图形处理器
节点
内存
数据保存方法
中央处理器
快照
日志
人工智能计算技术
恢复方法
存储计算机程序
参数
可读存储介质
计算机程序产品
电子设备
异常状态
备份
时效性
存储器
系统为您推荐了相关专利信息
拓扑网络
生态
分析系统
时间段
一维卷积神经网络
损伤预测方法
平衡车
驾驶者
决策树模型
姿态特征