摘要
本发明公开了专家并行训练耗时预测方法、装置、设备、介质及产品,涉及人工智能技术领域,通过将混合专家模型训练所采用的训练样本集进行多次采样得到的训练样本分别输入混合专家模型以监测混合专家模型的专家网络的激活状态参数,从而对专家并行训练中专家网络的激活情况进行准确预测;根据专家网络的激活状态参数和异构计算系统的计算节点的资源状态信息,计算计算节点执行迭代训练的耗时预测结果,并根据计算节点的耗时预测结果确定异构计算系统执行迭代训练的耗时预测结果,实现对混合专家模型的专家并行训练的耗时进行准确预测,解决相关技术中模型训练耗时预测方案无法准确预测混合专家模型的专家并行训练的耗时的问题。
技术关键词
异构计算系统
节点
网络
资源状态信息
训练样本集
非易失性存储介质
元素
参数
通信链路
内存
状态监测模块
存储计算机程序
人工智能技术
计算机程序产品
预测装置
处理器
时延
电子设备
系统为您推荐了相关专利信息
采摘方法
双目立体相机
水果果实
双目立体视觉相机
末端执行器
图像分割网络
超声图像分割方法
注意力
频域特征
调优方法
风电机组
暂态电压控制
灵敏度方程
有功功率
虚拟惯量