用于云端/端侧部署和微调以及应用大语言模型的方法

正文

推荐专利

申请号：CN202510942917

申请日期：2025-07-09

公开号：CN120849948A

公开日期：2025-10-28

类型：发明专利

摘要

本申请提供了一种用于在云端部署和微调大语言模型的方法，其包括：将微调辅助模型和大语言基础模型的联合体分割成第一模型部分和第二模型部分，在云服务器(2)中部署第二模型部分，并向端侧设备(1)发送第一模型部分(S1)；利用从端侧设备接收到的第一嵌入向量对第二模型部分进行训练，并向端侧设备发送通过第二模型部分处理第一嵌入向量得到的第二嵌入向量，在训练过程中固定大语言基础模型的第一参数(S2)；在训练至微调辅助模型收敛时，将大语言基础模型的第一参数和经训练的微调辅助模型的第二参数聚合为联合体的聚合参数，基于聚合参数为第二模型部分进行参数配置，并向端侧设备(1)发送配属于第一模型部分的聚合参数(S3)。

技术关键词

大语言模型解码器云服务器计算机程序指令参数令牌注意力基础云端车载控制器计算机程序产品模块车辆数据处理器载体

用于云端/端侧部署和微调以及应用大语言模型的方法

站点导航

APP 下载