一种基于基准测试的大语言模型微调联邦学习激励方法

正文

推荐专利

申请号：CN202411653694

申请日期：2024-11-19

公开号：CN119740636A

公开日期：2025-04-01

类型：发明专利

摘要

本发明公开了一种基于基准测试的大语言模型微调联邦学习激励方法。该方法包括：在进行大语言模型微调时，节点先对模型进行本地训练；完成本地训练后将训练的参数上传到中心节点，中心节点使用基准测试对该轮训练中节点的训练质量进行评价，基准测试可以准确地衡量出节点本地训练的参数质量与判断节点攻击；根据基准测试结果，更新节点的声誉值；随后中心节点根据评价结果与声誉值，使用联邦学习聚合方法对节点进行全局模型聚合。本发明为大语言模型微调的联邦学习设计了可行的激励机制，解决了在大语言模型微调联邦学习场景下缺乏激励机制的问题，可以吸引可靠节点上交高质量数据，排除低质量的节点贡献，可以进一步推动联邦学习应用落地。

技术关键词

联邦学习激励方法服务器大语言模型参数矩阵基准测试方法筛选方法预训练模型节点更新数据定义答案场景算法网络

系统为您推荐了相关专利信息

一种基于跨保真度神经网络的非定常流场快速预测方法

空间多尺度长短期记忆网络降维算法网格统计特征

一种基于双波段色比残差融合的红外弱小目标探测方法、系统、设备及介质

二次曲面方程双波段特征值像素尺寸

基于混合神经网络的光伏发电功率超短期预测方法及系统

光伏发电功率预测序列神经网络模型构建注意力梯度下降算法

基于YOLO v8算法的工业零件检测方法

工业零件检测算法动态样本图像

一种水风光多能互补调峰优化调度方法及系统

深度卷积生成对抗网络情景径流优化调度模型风光

一种基于基准测试的大语言模型微调联邦学习激励方法

站点导航

APP 下载