专家并行训练耗时预测方法、装置、设备、介质及产品

正文

推荐专利

申请号：CN202510874226

申请日期：2025-06-27

公开号：CN120373423B

公开日期：2025-09-02

类型：发明专利

摘要

本发明公开了专家并行训练耗时预测方法、装置、设备、介质及产品，涉及人工智能技术领域，通过将混合专家模型训练所采用的训练样本集进行多次采样得到的训练样本分别输入混合专家模型以监测混合专家模型的专家网络的激活状态参数，从而对专家并行训练中专家网络的激活情况进行准确预测；根据专家网络的激活状态参数和异构计算系统的计算节点的资源状态信息，计算计算节点执行迭代训练的耗时预测结果，并根据计算节点的耗时预测结果确定异构计算系统执行迭代训练的耗时预测结果，实现对混合专家模型的专家并行训练的耗时进行准确预测，解决相关技术中模型训练耗时预测方案无法准确预测混合专家模型的专家并行训练的耗时的问题。

技术关键词

异构计算系统节点网络资源状态信息训练样本集非易失性存储介质元素参数通信链路内存状态监测模块存储计算机程序人工智能技术计算机程序产品预测装置处理器时延电子设备

系统为您推荐了相关专利信息

一种水果智能化除遮采摘方法

采摘方法双目立体相机水果果实双目立体视觉相机末端执行器

一种超声图像分割方法、装置及设备

图像分割网络超声图像分割方法注意力频域特征调优方法

一种基于自适应下垂的构网型风电场暂态电压控制方法、装置、设备及存储介质

风电机组暂态电压控制灵敏度方程有功功率虚拟惯量

基于文本片段表征学习的地名识别方法、装置及设备

文本实体地名识别方法语义编码器

一种基于信用评分与智能合约的绿证-碳交易市场的构建方法

配额碳交易市场周期可再生能源评分机制

专家并行训练耗时预测方法、装置、设备、介质及产品

站点导航

APP 下载