摘要
本发明公开了一种通信高效的联邦学习多粒度分组微调方法,涉及信息安全技术领域,解决了当前联邦学习的通信开销大以及在数据非独立同分布即Non‑IID场景下的模型性能弱的技术问题;本发明通过LoRA低秩参数矩阵构建客户端的预训练模型;客户端对参数矩阵B进行非对称性微调并将矩阵B上传至服务器;服务器进行多粒度分组并计算组内加权平均低秩矩阵;服务器对各客户端对应的专家门控参数进行加权平均得到平均专家门控参数,并用于全局模型的推理。本发明通过利用低秩适应矩阵的非对称性训练模型降低了LoRA的训练和通信开销,并且通过LoRA结合混合专家的训练方式提升了模型在Non‑IID场景下的精度。
技术关键词
客户端
矩阵
微调方法
参数
服务器
预训练模型
模型块
信息安全技术
算法
标记
场景
基底
数据
精度
系统为您推荐了相关专利信息
样本
非暂态计算机可读存储介质
大语言模型
轨迹
处理器
数据管理方法
数据采集频率
数据传输协议
关键运行参数
批量数据传输