大模型训练方法、装置、设备、存储介质及程序产品

正文

推荐专利

申请号：CN202510513698

申请日期：2025-04-23

公开号：CN120387531A

公开日期：2025-07-29

类型：发明专利

摘要

本申请涉及联邦学习技术领域，提供一种大模型训练方法、装置、设备、存储介质及程序产品，该方法包括：在大模型联邦训练的每个通信轮次中，接收各参与方发送的因子矩阵；因子矩阵是由参与方对随机选择的局部向量因子进行局部迭代优化得到的，局部向量因子是对参与方本地的局部大模型的张量适配器的权重矩阵进行张量分解得到的；根据因子矩阵更新与随机选择的局部向量因子对应的全局向量因子，供各参与方更新本地的局部向量因子，完成一次联邦迭代。通过张量分解和对训练参数的随机选择，减少了计算资源的消耗和通信开销，并且，避免了误差项的叠加，缓解了数据异质性导致的模型收敛速度慢的问题，减少了大模型的训练时长，提高了训练效率。

技术关键词

模型训练方法因子矩阵多层感知机层索引适配器非暂态计算机可读存储介质联邦学习技术模型训练装置处理器计算机程序产品编解码器注意力存储器电子设备模块数据样本误差

系统为您推荐了相关专利信息

一种大气复合污染物健康影响评估方法、装置及预警系统

时间序列数据库空气质量健康指数预警系统层次结构模型层次分析法

基于GPU加速的隐式地质建模方法、系统和设备

网格地质建模方法矩阵颜色元素

面向多设备协同的星闪连接抗干扰动态优化方法

动态优化方法多设备协同协同通信数据分析模型模糊逻辑

静态随机存取存储器存内计算系统及方法

神经网络模型 SRAM存储阵列 SRAM存储单元元数据存储器模式

基于模糊逻辑模型的核电取水口生物群落变化预测系统

监测点模糊逻辑预测系统模糊隶属度子模块

大模型训练方法、装置、设备、存储介质及程序产品

站点导航

APP 下载