摘要
本发明公开了一种基于任务类型驱动的MoE模型路由优先级调度方法,其该方法首先基于数据集构造器,根据任务类别和原始数据语料库,构造不同结构的预训练和微调数据集。其次设计模型预训练阶段第一专家选择优先的调度策略,包括构建第一专家选择优先的调度和组合索引以及基于所有Token的第一专家选择优先的计算过程。最后设计微调阶段K个专家选择优先的调度策略,包括构建K个专家选择优先的调度和组合索引以及基于真实Token的K个专家选择优先的计算过程。本发明在保证MoE模型预训练阶段模型精度的前提下,提高训练效率,并保证微调任务完全是精度无损的。
技术关键词
优先级调度方法
索引
矩阵
模型预训练
策略
序列
阶段
数据
构建算法
排序算法
复杂度
网络
精度
编程
切片
逻辑
元素
物理
模式
系统为您推荐了相关专利信息
社交网络关键节点
挖掘方法
特征值
挖掘系统
指标
反射率数据
正则化参数
模型构建方法
偏最小二乘回归模型
波长
外呼机器人
意图识别方法
语音特征参数
主题
查询意图
霍尔元件
直线电机位置
补偿算法
基准
位置偏差量