一种基于联邦学习的多方大模型联合训练方法和装置

AITNT
正文
推荐专利
一种基于联邦学习的多方大模型联合训练方法和装置
申请号:CN202510484026
申请日期:2025-04-17
公开号:CN120415786A
公开日期:2025-08-01
类型:发明专利
摘要
本发明公开了一种基于联邦学习的多方大模型联合训练方法和装置,包括将待训练的大模型按照参数大小均匀划分到每个计算节点,所有节点设置s为随机种子,初始化模型参数;每个客户端使用自身持有的私域数据训练大模型,完成一轮训练后,将每个计算节点的梯度参数合成完整梯度Gi;生成与Gi相同形状的随机数矩阵Ri作为子秘密之一;计算Ti=Gi‑Ri作为另一个子秘密;将两个子秘密分别发送给两个中央服务器求和,得到最终更新梯度W;每个客户端将W划分为节点更新梯度并发送到对应节点,完成模型更新;重复上述过程直至大模型收敛或达到预设的迭代次数。本发明中客户端只需与中央服务器通信,秘密分享方案简洁,通信成本低,支持规模参数庞大的大模型训练。
技术关键词
模型联合训练方法 客户端 节点更新 服务器 模型更新 主节点 参数 模型训练模块 处理器 矩阵 种子 计算机程序产品 训练装置 存储器 数据 可读存储介质 电子设备 规模
系统为您推荐了相关专利信息
1
用于切片数据管理的模型同步处理方法及系统
数据管理 切片 云端服务器 可执行程序代码 参数
2
会话密钥生成方法、装置、电子设备和存储介质
密钥生成方法 服务端 密钥生成算法 私钥 生成会话密钥
3
动态部署网络隐身方法、装置、电子设备及存储介质
虚拟专用网络 传输路径 代理服务器 网络隐身方法 指数
4
基于零信任架构的大规模供应商动态评价系统
动态评价系统 控制中心 历史信息数据库 客户端 访问系统资源
5
车辆模型的网格划分方法、装置及服务器
车辆模型 网格划分方法 网格划分装置 网格模型 标识
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号