一种基于混合专家的大模型多语言增强模型融合方法

正文

推荐专利

申请号：CN202411690266

申请日期：2024-11-25

公开号：CN119538976A

公开日期：2025-02-28

类型：发明专利

摘要

本发明提出了一种基于混合专家的大模型多语言增强模型融合方法，包括以下步骤：步骤1，从锚点模型与语言专家模型中，选择待融合层；步骤2，构建融合模块；步骤3，使用融合模块，对锚点模型和语言专家模型中的每个待融合层进行融合，得到融合后的模型；步骤4，训练融合后的模型，得到最终的融合结果，完成所述基于混合专家的大模型多语言增强模型融合。

技术关键词

模型融合方法多语言前馈神经网络锚点注意力模块路由器线性二分类器元素超参数规模训练集矩阵间距数据

系统为您推荐了相关专利信息

消息队列集群的管理方法、装置、计算机设备及存储介质

消息队列组件决策集群服务器流量预测模型

一种基于统一语义空间的多模态媒资智能审核系统及方法

智能审核系统语义跨模态对齐模块文本特征向量

一种基于双序列预测模型的微电网能源管理方法及系统

序列预测模型能源管理方法发电量微电网系统多尺度特征提取

基于时空状态选择的发动机剩余使用寿命预测方法及系统

剩余使用寿命预测状态空间模型航空发动机传感器嵌入位置信息滑动时间窗口

一种基于Siamese网络的小样本慢性压力检测方法

心理压力检测方法样本数据神经网络模型注意力机制

一种基于混合专家的大模型多语言增强模型融合方法

站点导航

APP 下载