面向代码任务的大语言模型的联邦学习训练方法及装置

正文

推荐专利

申请号：CN202510409307

申请日期：2025-04-02

公开号：CN120278232A

公开日期：2025-07-08

类型：发明专利

摘要

本发明提供面向代码任务的大语言模型的联邦学习训练方法及装置，结合代码任务筛选参与大语言模型训练的组织节点，并对组织节点的训练数据进行结构化预处理，减少大语言模型训练过程中对不必要数据的筛选阶段。进一步的，通过各个组织节点对大语言模型的适配器模型部分进行微调，减少数据处理量，并将微调后的适配器模型与预先选定的基座模型融合得到训练后的全局模型。更进一步，对各个组织节点的具体代码语言进行标签化处理，在大语言模型训练过程中可快速针对具体代码语言的训练数据调整参数，不需要进行过于繁杂的代码语言遍历或识别过程，提高大语言模型训练的效率。

技术关键词

服务器节点学习训练方法适配器联邦学习系统学习训练装置组织数据模型更新基座大语言模型输出模块参数表达式标签处理器计算机设备可读存储介质校正

系统为您推荐了相关专利信息

任务分配方法、装置、设备及存储介质

任务分配模型任务分配方法适配器网络样本

基于信息一致性驱动的梯度压缩器及梯度压缩方法、设备

梯度压缩方法压缩器拉格朗日表达式多尺度

一种BMS板自动唤醒及串口通信系统

串口通信系统充电控制模块储能电芯陶瓷电容外部适配器

基于对比语言图像预训练多模态特征融合的监控视频异常事件检测方法及系统

多模态特征融合编码特征分类神经网络预训练模型图像编码器

一种基于在线学习的分布式组件监控方法

深度学习网络模型分布式组件硬盘使用率数据监控方法

面向代码任务的大语言模型的联邦学习训练方法及装置

站点导航

APP 下载