混合专家模型的训练方法、装置、计算机设备、可读存储介质和程序产品

AITNT
正文
推荐专利
混合专家模型的训练方法、装置、计算机设备、可读存储介质和程序产品
申请号:CN202411969731
申请日期:2024-12-30
公开号:CN119830952A
公开日期:2025-04-15
类型:发明专利
摘要
本申请涉及一种混合专家模型的训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。该方法包括:获取与大模型输入关联的混合专家模型的训练样本集;训练样本集包括大模型的输入数据以及输入数据对应的输入解析标签信息;将训练样本集中的目标样本输入混合专家模型,得到混合专家模型中每个专家模型的激活概率信息、混合专家模型的目标输出结果和加载专家模型的子输出结果;根据每个专家模型的模型参数、目标样本、目标输出结果和子输出结果,得到专家区分奖励信息;根据激活概率信息、专家区分奖励信息、目标样本和目标输出结果,对混合专家模型进行迭代训练,得到训练完成的混合专家模型。采用本方法能提高混合专家模型鲁棒性。
技术关键词
训练样本集 计算机设备 参数 计算机程序产品 可读存储介质 模型训练模块 处理器 训练装置 数据 基线 标签 输入模块 存储器 鲁棒性 网络
系统为您推荐了相关专利信息
1
一种飞行器复杂系统功能分析行为聚类设计方法
设计结构矩阵 参数 聚类 抗体 飞行器系统
2
基于提示调优的中医切诊信息词性标注方法、系统及介质
词性标注方法 预训练语言模型 词性标注系统 标签 多层网络结构
3
一种半导体料板用自动装卸控制系统
装卸控制系统 翘曲高度 路径搜索算法 半导体 视觉定位模块
4
一种地图要素预测模型的训练方法、装置、设备及存储介质
地图要素 样本 场景 解码器 网络
5
一种实时数据采集方法及系统
像素点 交通监控图像 连续性 图像数据采集技术 实时数据采集系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号