基于联邦学习的大语言模型微调方法、装置、设备及介质

正文

推荐专利

申请号：CN202510222314

申请日期：2025-02-27

公开号：CN120069081A

公开日期：2025-05-30

类型：发明专利

摘要

本申请公开了基于联邦学习的大语言模型微调方法、装置、设备及介质，涉及联邦学习技术领域，应用于服务端，包括：获取联邦微调任务，并利用预设经验指导模型对联邦微调任务中的数据分别进行处理以得到相应的特征向量；将特征向量、预设经验指导模型以及基础大语言模型下发至各客户端，以便各所述客户端基于本地微调数据集、特征向量、预设经验指导模型对基础大语言模型进行模型微调处理以得到微调后大语言模型，并对微调后大语言模型进行聚合处理以得到新的特征向量，然后跳转至所述特征向量、预设经验指导模型以及基础大语言模型下发至各客户端的步骤直至满足预设微调训练结束条件。如此一来，通过个性化联邦学习实现了大语言模型的微调。

技术关键词

大语言模型微调方法客户端基础参数深度学习模型数据处理工具联邦学习技术服务端策略数据中心微调装置可读存储介质处理器节点电子设备模块存储器

系统为您推荐了相关专利信息

基于在线神经网络学习的自动驾驶轨迹快速跟踪控制方法

径向基神经网络跟踪控制方法模糊推理模型预测控制器在线学习机制

一种基于OTFS的通信波形性能评估方法

性能评估方法评估指标体系波形层次分析法变异系数法

eMBB/URLLC共存场景的智能资源分配方法、装置、终端及储存介质

迷你时隙智能资源分配方法表达式速率网络

交互方法、数据处理方法、装置

对话生成模型兴趣点人工智能模型交互方法数据处理方法

一种工程塑料生产质量检测方法及系统

工程塑料表面多尺度滑动窗口跨模态融合特征注塑机视觉特征提取

基于联邦学习的大语言模型微调方法、装置、设备及介质

站点导航

APP 下载