一种基于动态层选择的高效联邦学习大模型训练方法

正文

推荐专利

申请号：CN202410907389

申请日期：2024-07-08

公开号：CN119026707B

公开日期：2025-06-27

类型：发明专利

摘要

本发明公开了一种基于动态层选择的高效联邦学习大模型训练方法，涉及联邦学习的高效训练技术领域。在本发明中，由服务器端选出部分最重要的层，交由客户端进行训练，即将部分计算量摊派到服务器端上，而客户端仅需更新极少部分的层的参数量，从而实现了对客户端计算压力与上传压力的极大减少，显著降低了客户端的计算压力和通信压力；本发明选出部分最重要的层具体为：服务器基于少量的本地训练数据对待训练模型进行初步训练，并获取待训练模型的每一线性层的梯度值，并基于该梯度值计算每一线性层的重要性评分，服务器选择前若干最高重要性评分和后若干个最低重要评分所对应的线性层作为当前的重要层；客户端根据本地训练结果仅训练部分最重要的层，从而极大减少了训练的计算需求和上传数据的参数量。同时，本发明无需对模型进行额外更改，因而具有很强的可扩展性。

技术关键词

服务器客户端模型训练方法线性联邦学习系统动态参数大语言模型策略压力数据因子框架

系统为您推荐了相关专利信息

推板窑堆堵故障预测方法、装置、计算机设备及介质

风险评估值故障预测模型故障预测方法匣钵高风险

一种基于代理重加密的烟草零售客户信用数据安全共享方法

分片加密数据客户储存设备代理服务器

一种基于特征点检测的生猪行为识别方法

特征点检测模型识别方法空间结构信息门控循环单元编码模块

一种先心病合并智力发育落后的预测方法、系统、电子设备及存储介质

基因表达数据智力 LightGBM模型 mRNA表达量 XGBoost模型

基于风险评估和用户满意度的多主体协同电力共享双层嵌套博弈虚拟电厂优化方法

配电网运营商双层优化模型风险评估模型 KKT条件聚合体

一种基于动态层选择的高效联邦学习大模型训练方法

站点导航

APP 下载