摘要
本发明提供面向代码任务的大语言模型的联邦学习训练方法及装置,结合代码任务筛选参与大语言模型训练的组织节点,并对组织节点的训练数据进行结构化预处理,减少大语言模型训练过程中对不必要数据的筛选阶段。进一步的,通过各个组织节点对大语言模型的适配器模型部分进行微调,减少数据处理量,并将微调后的适配器模型与预先选定的基座模型融合得到训练后的全局模型。更进一步,对各个组织节点的具体代码语言进行标签化处理,在大语言模型训练过程中可快速针对具体代码语言的训练数据调整参数,不需要进行过于繁杂的代码语言遍历或识别过程,提高大语言模型训练的效率。
技术关键词
服务器节点
学习训练方法
适配器
联邦学习系统
学习训练装置
组织
数据
模型更新
基座
大语言模型
输出模块
参数
表达式
标签
处理器
计算机设备
可读存储介质
校正
系统为您推荐了相关专利信息
串口通信系统
充电控制模块
储能电芯
陶瓷电容
外部适配器
多模态特征融合
编码特征
分类神经网络
预训练模型
图像编码器
深度学习网络模型
分布式组件
硬盘使用率
数据
监控方法