摘要
本申请提供了一种用于在云端部署和微调大语言模型的方法,其包括:将微调辅助模型和大语言基础模型的联合体分割成第一模型部分和第二模型部分,在云服务器(2)中部署第二模型部分,并向端侧设备(1)发送第一模型部分(S1);利用从端侧设备接收到的第一嵌入向量对第二模型部分进行训练,并向端侧设备发送通过第二模型部分处理第一嵌入向量得到的第二嵌入向量,在训练过程中固定大语言基础模型的第一参数(S2);在训练至微调辅助模型收敛时,将大语言基础模型的第一参数和经训练的微调辅助模型的第二参数聚合为联合体的聚合参数,基于聚合参数为第二模型部分进行参数配置,并向端侧设备(1)发送配属于第一模型部分的聚合参数(S3)。
技术关键词
大语言模型
解码器
云服务器
计算机程序指令
参数
令牌
注意力
基础
云端
车载控制器
计算机程序产品
模块
车辆
数据
处理器
载体