一种基于动态层选择的高效联邦学习大模型训练方法

AITNT
正文
推荐专利
一种基于动态层选择的高效联邦学习大模型训练方法
申请号:CN202410907389
申请日期:2024-07-08
公开号:CN119026707B
公开日期:2025-06-27
类型:发明专利
摘要
本发明公开了一种基于动态层选择的高效联邦学习大模型训练方法,涉及联邦学习的高效训练技术领域。在本发明中,由服务器端选出部分最重要的层,交由客户端进行训练,即将部分计算量摊派到服务器端上,而客户端仅需更新极少部分的层的参数量,从而实现了对客户端计算压力与上传压力的极大减少,显著降低了客户端的计算压力和通信压力;本发明选出部分最重要的层具体为:服务器基于少量的本地训练数据对待训练模型进行初步训练,并获取待训练模型的每一线性层的梯度值,并基于该梯度值计算每一线性层的重要性评分,服务器选择前若干最高重要性评分和后若干个最低重要评分所对应的线性层作为当前的重要层;客户端根据本地训练结果仅训练部分最重要的层,从而极大减少了训练的计算需求和上传数据的参数量。同时,本发明无需对模型进行额外更改,因而具有很强的可扩展性。
技术关键词
服务器 客户端 模型训练方法 线性 联邦学习系统 动态 参数 大语言模型 策略 压力 数据 因子 框架
系统为您推荐了相关专利信息
1
推板窑堆堵故障预测方法、装置、计算机设备及介质
风险评估值 故障预测模型 故障预测方法 匣钵 高风险
2
一种基于代理重加密的烟草零售客户信用数据安全共享方法
分片 加密数据 客户 储存设备 代理服务器
3
一种基于特征点检测的生猪行为识别方法
特征点检测模型 识别方法 空间结构信息 门控循环单元 编码模块
4
一种先心病合并智力发育落后的预测方法、系统、电子设备及存储介质
基因表达数据 智力 LightGBM模型 mRNA表达量 XGBoost模型
5
基于风险评估和用户满意度的多主体协同电力共享双层嵌套博弈虚拟电厂优化方法
配电网运营商 双层优化模型 风险评估模型 KKT条件 聚合体
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号