摘要
本申请涉及联邦学习技术领域,提供一种大模型训练方法、装置、设备、存储介质及程序产品,该方法包括:在大模型联邦训练的每个通信轮次中,接收各参与方发送的因子矩阵;因子矩阵是由参与方对随机选择的局部向量因子进行局部迭代优化得到的,局部向量因子是对参与方本地的局部大模型的张量适配器的权重矩阵进行张量分解得到的;根据因子矩阵更新与随机选择的局部向量因子对应的全局向量因子,供各参与方更新本地的局部向量因子,完成一次联邦迭代。通过张量分解和对训练参数的随机选择,减少了计算资源的消耗和通信开销,并且,避免了误差项的叠加,缓解了数据异质性导致的模型收敛速度慢的问题,减少了大模型的训练时长,提高了训练效率。
技术关键词
模型训练方法
因子
矩阵
多层感知机层
索引
适配器
非暂态计算机可读存储介质
联邦学习技术
模型训练装置
处理器
计算机程序产品
编解码器
注意力
存储器
电子设备
模块
数据
样本
误差
系统为您推荐了相关专利信息
时间序列数据库
空气质量健康指数
预警系统
层次结构模型
层次分析法
动态优化方法
多设备协同
协同通信
数据分析模型
模糊逻辑
神经网络模型
SRAM存储阵列
SRAM存储单元
元数据存储器
模式