摘要
本说明书提供了一种预训练模型微调方法及相关设备,应用于与模型提供方对应的第一计算设备;多个数据提供方持有与不同推理任务对应的私有数据。该方法包括:将待微调的预训练模型发送至与多个数据提供方对应的多个第二计算设备,以使多个第二计算设备基于持有的私有数据对预训练模型进行微调训练;构建与预训练模型对应的MoE门控网络,基于多个第二计算设备得到的多个微调后的预训练模型对MoE门控网络进行训练;MoE门控网络用于:根据待执行的推理任务与多个微调后的预训练模型之间的相关性,确定多个微调后的预训练模型的权重,并根据确定出的权重,将多个微调后的预训练模型执行该推理任务所输出的多个推理结果进行加权融合。
技术关键词
预训练模型
微调方法
网络
数据
计算机程序产品
微调装置
处理器
微调单元
指令
参数
可读存储介质
存储器
系统为您推荐了相关专利信息
供应链协同管理方法
区块链智能合约
集装箱
模糊综合评价
动态
导航模型训练方法
导航兴趣点
车载导航系统
生成导航路径
语音
植物护坡
分析系统
图像识别单元
数据传输模块
深度学习引擎