一种联邦大语言模型的训练方法、装置、设备及介质

AITNT
正文
推荐专利
一种联邦大语言模型的训练方法、装置、设备及介质
申请号:CN202510064621
申请日期:2025-01-15
公开号:CN119990367A
公开日期:2025-05-13
类型:发明专利
摘要
本说明书实施例公开了一种联邦大语言模型的训练方法、装置、设备及介质,方法包括:对预置大语言模型蒸馏获得对应的小型语言模型,并将其下发至各个客户端;根据各客户端的本地私有数据对小型语言模型进行训练获得对应的模型权重参数矩阵,上传到服务器端;基于奇异值分解对各模型权重参数矩阵进行分解,以筛选关键奇异值与对应奇异向量并基于此更新模型权重参数;对更新后的模型权重参数进行加权,获得客户端汇总模型,以基于客户端汇总模型与小型语言模型进行加权,获得服务器端的当前小型语言模型;将当前小型语言模型基于预置大语言模型与当前小型语言模型的公共数据集进行知识迁移,实现对于预置大语言模型的训练更新。
技术关键词
大语言模型 客户端 参数 矩阵 计算机可执行指令 蒸馏 非易失性存储介质 场景 标签 规模 关键词 训练设备 传播算法 训练装置 处理器通信 数据 存储器 脚本
系统为您推荐了相关专利信息
1
一种气象雷达鸟群识别与目标差异性分析方法
差异性分析方法 气象雷达数据 鸟群识别 模糊逻辑 降维特征
2
高效埋线机与压机一体化生产线的智能调度方法
智能调度方法 支持向量回归算法 压机 一体化生产线 智能调度系统
3
一种光子并行矩阵乘法运算芯片及其应用系统
矩阵乘法运算 阵列波导光栅 信号发生器 调制光信号 探测器
4
一种基于退火梯度算法的热流实时反演方法及装置
判断准则 梯度算法 反演方法 蒙特卡洛 反演装置
5
LLC谐振参数正向设计方法、装置、设备、介质及程序产品
LLC谐振变换器 正向设计方法 轨迹参数 数学模型 粒子
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号