基于高效微调和联邦学习的行业大模型训练方法及系统

正文

推荐专利

申请号：CN202411463393

申请日期：2024-10-21

公开号：CN118982074B

公开日期：2025-04-11

类型：发明专利

摘要

本发明提出一种基于高效微调和联邦学习的行业大模型训练方法及系统，涉及联邦学习领域。该方法由中心端执行，包括：获取原始全局模型，初始化可调低秩矩阵；所述可调低秩矩阵用于根据客户端资源量进行秩缩放；将模型结构和可调低秩矩阵发送给各客户端，以使各客户端基于本地数据对可调低秩矩阵进行微调训练，得到更新的可调低秩矩阵，并发送至中心端；将更新的可调低秩矩阵进行聚合，更新原始全局模型的权重文件，得到优化的全局模型。本发明客户端在微调训练时对预训练权重进行量化，并对具有秩缩放功能的可调低秩矩阵进行微调训练，以提取客户端本地数据有效特征，实现了模型参数的灵活调整与资源的高效利用。

技术关键词

矩阵客户端模型训练方法缩放功能固态模型训练系统动态线性资源数据上传模块可读存储介质计算机电子设备处理器通信参数存储器指令

基于高效微调和联邦学习的行业大模型训练方法及系统

站点导航

APP 下载