混合专家模型的训练方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
混合专家模型的训练方法、装置、电子设备及存储介质
申请号:CN202510004762
申请日期:2025-01-02
公开号:CN119962604A
公开日期:2025-05-09
类型:发明专利
摘要
本发明提供一种混合专家模型的训练方法、装置、电子设备及存储介质,属于大语言模型技术领域,通过将前馈神经网络转换为多个专家单元,提高了第一预设混合专家模型的推理效率和部署灵活性。通过多领域训练样本训练多个输出概率至相同,使得第二预设混合专家模型能够快速收敛。通过多领域训练样本对输出概率进行再次训练,进一步优化了门控层的性能。通过单领域训练样本对第三预设混合专家模型进行训练,使混合专家模型在特定领域达到最佳性能。本发明通过将前馈神经网络转换为多个专家单元,然后对门控层进行三个不同层次的训练,不仅提高了混合专家模型的训练效率,还提高了混合专家模型在特定领域中的数据处理精度和鲁棒性。
技术关键词
前馈神经网络 大语言模型 非暂态计算机可读存储介质 误差 答案 标签 电子设备 样本 文本 处理器 参数 训练装置 数据 模块 存储器 鲁棒性 精度
系统为您推荐了相关专利信息
1
一种面向自动驾驶的图像重建方法及相关设备
图像重建方法 像素点 三维点云模型 编码器 解码器
2
一种基于多智能体强化学习的交通信号灯协同控制方法及相关装置
交通信号灯 协同控制方法 多智能体强化学习 大语言模型 规划
3
一种多变量融合的电力负荷预测方法及系统
电力负荷预测方法 谐波畸变率 负荷预测模型 频段 数据屏蔽
4
一种基于FLNN神经网络带有ESO力矩补偿的最优控制方法及系统
控制力矩 动态机器人 系统误差 状态观测器 机械臂
5
一种桥梁支座不锈钢板智能激光熔覆系统及方法
激光熔覆系统 激光熔覆头 桥梁支座 不锈钢板 送丝机构
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号