摘要
本说明书实施例公开了一种联邦大语言模型的训练方法、装置、设备及介质,方法包括:对预置大语言模型蒸馏获得对应的小型语言模型,并将其下发至各个客户端;根据各客户端的本地私有数据对小型语言模型进行训练获得对应的模型权重参数矩阵,上传到服务器端;基于奇异值分解对各模型权重参数矩阵进行分解,以筛选关键奇异值与对应奇异向量并基于此更新模型权重参数;对更新后的模型权重参数进行加权,获得客户端汇总模型,以基于客户端汇总模型与小型语言模型进行加权,获得服务器端的当前小型语言模型;将当前小型语言模型基于预置大语言模型与当前小型语言模型的公共数据集进行知识迁移,实现对于预置大语言模型的训练更新。
技术关键词
大语言模型
客户端
参数
矩阵
计算机可执行指令
蒸馏
非易失性存储介质
场景
标签
规模
关键词
训练设备
传播算法
训练装置
处理器通信
数据
存储器
脚本
系统为您推荐了相关专利信息
差异性分析方法
气象雷达数据
鸟群识别
模糊逻辑
降维特征
智能调度方法
支持向量回归算法
压机
一体化生产线
智能调度系统
矩阵乘法运算
阵列波导光栅
信号发生器
调制光信号
探测器
LLC谐振变换器
正向设计方法
轨迹参数
数学模型
粒子