摘要
本申请涉及一种混合专家模型的训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。该方法包括:获取与大模型输入关联的混合专家模型的训练样本集;训练样本集包括大模型的输入数据以及输入数据对应的输入解析标签信息;将训练样本集中的目标样本输入混合专家模型,得到混合专家模型中每个专家模型的激活概率信息、混合专家模型的目标输出结果和加载专家模型的子输出结果;根据每个专家模型的模型参数、目标样本、目标输出结果和子输出结果,得到专家区分奖励信息;根据激活概率信息、专家区分奖励信息、目标样本和目标输出结果,对混合专家模型进行迭代训练,得到训练完成的混合专家模型。采用本方法能提高混合专家模型鲁棒性。
技术关键词
训练样本集
计算机设备
参数
计算机程序产品
可读存储介质
模型训练模块
处理器
训练装置
数据
基线
标签
输入模块
存储器
鲁棒性
网络
系统为您推荐了相关专利信息
词性标注方法
预训练语言模型
词性标注系统
标签
多层网络结构
装卸控制系统
翘曲高度
路径搜索算法
半导体
视觉定位模块
像素点
交通监控图像
连续性
图像数据采集技术
实时数据采集系统