摘要
本发明公开一种基于联邦学习的大模型多客户端协作定位知识编辑方法,包括以下步骤:1)构建LLM模型2)构建FedLEKE任务;3)执行FedLEKE任务,优化Transformer层的隐藏状态,从而对LLM模型中前馈网络的权重进行微调,更新LLM模型;4)各客户端生成中间知识向量,并上传至服务器;5)在预定义的时间槽ti∈T,服务器将存储的MKVs分发给各客户端;6)各客户端基于余弦相似度动态检索服务器中相关中间知识向量,对知识向量进行再编辑,并根据再编辑的知识向量对LLM模型中的关联参数进行定位与修改。本发明保留了非联邦LEKE 96%以上的性能,同时明显优于基于FedAvg的基线约两倍。
技术关键词
知识编辑方法
客户端协作
服务器
解码器
标记
序列
网络
编码
算法
参数
注意力
非线性
动态
键值
基线
记忆
模板
矩阵
系统为您推荐了相关专利信息
拉普拉斯
残差网络
图像风格迁移方法
前馈神经网络
归一化方法
桥梁病害识别方法
图像分割模型
通用图像标注工具
比例尺
分割掩模
月季花瓣
SNP位点组合
探针
全基因组关联分析
分析测序数据