基于参数高效微调的大型语言模型训练方法

正文

推荐专利

基于参数高效微调的大型语言模型训练方法

申请号：CN202411629653

申请日期：2024-11-15

公开号：CN119578545B

公开日期：2025-07-15

类型：发明专利

摘要

本发明公开了一种基于参数高效微调的大型语言模型训练方法。大型语言模型训练方法包括：针对训练对象的大型语言模型，将大型语言模型划分为客户端预训练模型和服务器端预训练模型两部分；联合客户端预训练模型和服务器端预训练模型共同进行并行协作训练，在训练过程中，采用参数高效微调技术来对客户端预训练模型和服务器端预训练模型进行并行训练；待训练完成后，采用模型聚合的方法，将客户端预训练模型和服务器端预训练模型合并起来；重复上述步骤，直至作为训练对象的大型语言模型收敛为止。本发明的大型语言模型训练方法基于分割联邦学习框架，并且结合了FL的并行训练优势和SL的模型分割优势，大大提高了训练效率。

技术关键词

预训练模型语言模型训练方法客户端设备微调技术联邦学习策略服务器节点加权平均策略数据通信协议更新模型参数网络结构微调方法大语言模型对象模型更新数据分布副本

系统为您推荐了相关专利信息

一种人脸一致性多角度镜头视频生成方法、装置

多角度视频生成方法视频生成装置图像生成模型镜头

一种基于数据扩增与语义图谱的SegTCLIP胶质瘤分割方法、系统及应用

语义图谱文本分割方法像素图像嵌入

相似有机反应检索方法及存储介质

检索方法数据项组份指纹标识

一种大型语言模型训练方法、装置、设备及存储介质

语言模型训练方法模型训练装置数据训练集更新模型参数

基层矛盾纠纷风险评估方法、系统、设备及存储介质

风险评估模型风险评估方法预训练模型大语言模型分析事件

基于参数高效微调的大型语言模型训练方法

站点导航

APP 下载