一种预训练模型微调方法及相关设备

AITNT
正文
推荐专利
一种预训练模型微调方法及相关设备
申请号:CN202411129149
申请日期:2024-08-15
公开号:CN119129649A
公开日期:2024-12-13
类型:发明专利
摘要
本说明书提供了一种预训练模型微调方法及相关设备,应用于与模型提供方对应的第一计算设备;多个数据提供方持有与不同推理任务对应的私有数据。该方法包括:将待微调的预训练模型发送至与多个数据提供方对应的多个第二计算设备,以使多个第二计算设备基于持有的私有数据对预训练模型进行微调训练;构建与预训练模型对应的MoE门控网络,基于多个第二计算设备得到的多个微调后的预训练模型对MoE门控网络进行训练;MoE门控网络用于:根据待执行的推理任务与多个微调后的预训练模型之间的相关性,确定多个微调后的预训练模型的权重,并根据确定出的权重,将多个微调后的预训练模型执行该推理任务所输出的多个推理结果进行加权融合。
技术关键词
预训练模型 微调方法 网络 数据 计算机程序产品 微调装置 处理器 微调单元 指令 参数 可读存储介质 存储器
系统为您推荐了相关专利信息
1
基于集装箱物流的多式联运端到端供应链协同管理方法
供应链协同管理方法 区块链智能合约 集装箱 模糊综合评价 动态
2
基于图正则化损失的半监督式新生儿运动类型预测方法
关节点 视频段 动作特征 序列 运动
3
一种投喂动物营养物质的系统、方法、装置、设备和可读存储介质
动物饲料 投喂方法 投料模块 饲料配方 传输模块
4
语音导航模型训练方法、装置、导航方法及车载导航系统
导航模型训练方法 导航兴趣点 车载导航系统 生成导航路径 语音
5
矿区植物护坡根系监测与分析系统
植物护坡 分析系统 图像识别单元 数据传输模块 深度学习引擎
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号