一种基于专家负载预测和序列并行的混合专家模型通信优化方法

正文

推荐专利

申请号：CN202510409993

申请日期：2025-04-02

公开号：CN120263646A

公开日期：2025-07-04

类型：发明专利

摘要

本发明公开了一种基于专家负载预测和序列并行的混合专家模型通信优化方法，先通过实时采集MoE模型训练迭代中的专家负载数据，结合滑动时间窗口维护机制对专家负载进行在线监测与分析，并基于距离差分算法动态调整滑动窗口大小，以构建专家负载的时变特征表达空间；建立历史的专家负载的时变特征表达空间与未来专家容量需求的映射关系，并通过专家负载预测方法实现专家容量的弹性调度；基于序列并行的专家计算通信并行，根据专家间训练数据的独立性和专家负载的时变特征表达空间，对MoE模型中的全局Al l Gather的通信进行专家级别的拆分，并通过流水线方式将单个专家的Al l Gather通信与计算任务并行执行。

技术关键词

通信优化方法滑动窗口负载预测方法弹性调度差分算法滑动时间窗口流水线方式机器学习算法模型全局分析方法动态序列关系数据机制时延阶段在线周期策略

系统为您推荐了相关专利信息

一种耦合水动力模型的全流域洪水演进方法

水动力模型网格三维实景模型滑动窗口水面

海浪高度的预测方法和装置、存储介质及电子装置

动态预测模型海浪高分辨率摄像头编码器长短期记忆网络

基于计算机视觉的遥控器液晶屏图像检测方法

图像检测方法计算机视觉液晶屏正则化参数信息熵

基于多源传感器的井下无轨胶轮车防溜车预警方法

车辆前方区域车辆周围环境预警方法视觉特征胶轮

一种生成典型风电功率场景的方法、装置及存储介质

电网数据平台历史风速数据典型时间段风电预测方法

一种基于专家负载预测和序列并行的混合专家模型通信优化方法

站点导航

APP 下载