摘要
本申请公开了基于联邦学习的大语言模型微调方法、装置、设备及介质,涉及联邦学习技术领域,应用于服务端,包括:获取联邦微调任务,并利用预设经验指导模型对联邦微调任务中的数据分别进行处理以得到相应的特征向量;将特征向量、预设经验指导模型以及基础大语言模型下发至各客户端,以便各所述客户端基于本地微调数据集、特征向量、预设经验指导模型对基础大语言模型进行模型微调处理以得到微调后大语言模型,并对微调后大语言模型进行聚合处理以得到新的特征向量,然后跳转至所述特征向量、预设经验指导模型以及基础大语言模型下发至各客户端的步骤直至满足预设微调训练结束条件。如此一来,通过个性化联邦学习实现了大语言模型的微调。
技术关键词
大语言模型
微调方法
客户端
基础
参数
深度学习模型
数据处理工具
联邦学习技术
服务端
策略
数据中心
微调装置
可读存储介质
处理器
节点
电子设备
模块
存储器
系统为您推荐了相关专利信息
径向基神经网络
跟踪控制方法
模糊推理
模型预测控制器
在线学习机制
性能评估方法
评估指标体系
波形
层次分析法
变异系数法
对话生成模型
兴趣点
人工智能模型
交互方法
数据处理方法
工程塑料表面
多尺度滑动窗口
跨模态融合特征
注塑机
视觉特征提取