基于弹性联邦低秩适配微调的大语言模型训练方法及系统

正文

推荐专利

申请号：CN202411482255

申请日期：2024-10-23

公开号：CN119443311B

公开日期：2025-09-26

类型：发明专利

摘要

本发明公开了一种基于弹性联邦低秩适配微调的大语言模型训练方法及系统，采用基于奇异值分解(SVD)的联邦聚合，将客户端本地LoRA模块重构为本地增量矩阵，然后聚合为全局增量矩阵，并通过SVD生成下一轮次的LoRA模块，有效消除传统FedLoRA的聚合误差。本发明为每个权重矩阵动态分配LoRA秩，实现了统计与硬件效率的平衡。为进一步减少通信开销并保持模型精度，本发明引入自适应矩阵冻结机制，依据权重矩阵的训练稳定性判断是否进行冻结。本发明解决了传统FedLoRA在训练效率、通信开销、模型精度等方面的挑战。

技术关键词

语言模型训练方法矩阵客户端语言模型训练系统服务器参数随机梯度下降计算机程序指令周期动态模型训练装置算法分发模块处理器存储装置索引实体元素

系统为您推荐了相关专利信息

一种智能车型诊断的快速定位方法和系统

客户端车型诊断系统快速定位方法快捷键

一种基于长短期记忆神经网络负荷预测的电-气综合能源系统分布式动态状态估计方法

协方差矩阵长短期记忆神经网络动态状态估计方法气综合能源系统气互联综合能源系统

一种多枪顶吹连续吹炼智能化系统及方法

智能化系统交互模型智能反馈控制喷枪子模块

一种突显温度影响特性的多维非线性行为模型数据测试装置及建立方法

矢量网络分析仪数据测试装置非线性模型建立方法高低温箱

基于多方矩阵乘法的纵向联邦逻辑回归方法、装置及系统

分片逻辑回归方法矩阵横向联邦生成随机数

基于弹性联邦低秩适配微调的大语言模型训练方法及系统

站点导航

APP 下载