一种联邦大语言模型的训练方法、装置、设备及介质

正文

推荐专利

申请号：CN202510064621

申请日期：2025-01-15

公开号：CN119990367A

公开日期：2025-05-13

类型：发明专利

摘要

本说明书实施例公开了一种联邦大语言模型的训练方法、装置、设备及介质，方法包括：对预置大语言模型蒸馏获得对应的小型语言模型，并将其下发至各个客户端；根据各客户端的本地私有数据对小型语言模型进行训练获得对应的模型权重参数矩阵，上传到服务器端；基于奇异值分解对各模型权重参数矩阵进行分解，以筛选关键奇异值与对应奇异向量并基于此更新模型权重参数；对更新后的模型权重参数进行加权，获得客户端汇总模型，以基于客户端汇总模型与小型语言模型进行加权，获得服务器端的当前小型语言模型；将当前小型语言模型基于预置大语言模型与当前小型语言模型的公共数据集进行知识迁移，实现对于预置大语言模型的训练更新。

技术关键词

大语言模型客户端参数矩阵计算机可执行指令蒸馏非易失性存储介质场景标签规模关键词训练设备传播算法训练装置处理器通信数据存储器脚本

系统为您推荐了相关专利信息

一种气象雷达鸟群识别与目标差异性分析方法

差异性分析方法气象雷达数据鸟群识别模糊逻辑降维特征

高效埋线机与压机一体化生产线的智能调度方法

智能调度方法支持向量回归算法压机一体化生产线智能调度系统

一种光子并行矩阵乘法运算芯片及其应用系统

矩阵乘法运算阵列波导光栅信号发生器调制光信号探测器

一种基于退火梯度算法的热流实时反演方法及装置

判断准则梯度算法反演方法蒙特卡洛反演装置

LLC谐振参数正向设计方法、装置、设备、介质及程序产品

LLC谐振变换器正向设计方法轨迹参数数学模型粒子

一种联邦大语言模型的训练方法、装置、设备及介质

站点导航

APP 下载