混合专家模型的训练方法、装置、计算机设备、可读存储介质和程序产品

正文

推荐专利

申请号：CN202411969731

申请日期：2024-12-30

公开号：CN119830952A

公开日期：2025-04-15

类型：发明专利

摘要

本申请涉及一种混合专家模型的训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。该方法包括：获取与大模型输入关联的混合专家模型的训练样本集；训练样本集包括大模型的输入数据以及输入数据对应的输入解析标签信息；将训练样本集中的目标样本输入混合专家模型，得到混合专家模型中每个专家模型的激活概率信息、混合专家模型的目标输出结果和加载专家模型的子输出结果；根据每个专家模型的模型参数、目标样本、目标输出结果和子输出结果，得到专家区分奖励信息；根据激活概率信息、专家区分奖励信息、目标样本和目标输出结果，对混合专家模型进行迭代训练，得到训练完成的混合专家模型。采用本方法能提高混合专家模型鲁棒性。

技术关键词

训练样本集计算机设备参数计算机程序产品可读存储介质模型训练模块处理器训练装置数据基线标签输入模块存储器鲁棒性网络

系统为您推荐了相关专利信息

一种飞行器复杂系统功能分析行为聚类设计方法

设计结构矩阵参数聚类抗体飞行器系统

基于提示调优的中医切诊信息词性标注方法、系统及介质

词性标注方法预训练语言模型词性标注系统标签多层网络结构

一种半导体料板用自动装卸控制系统

装卸控制系统翘曲高度路径搜索算法半导体视觉定位模块

一种地图要素预测模型的训练方法、装置、设备及存储介质

地图要素样本场景解码器网络

一种实时数据采集方法及系统

像素点交通监控图像连续性图像数据采集技术实时数据采集系统

混合专家模型的训练方法、装置、计算机设备、可读存储介质和程序产品

站点导航

APP 下载