大模型训练方法、装置、设备、存储介质及程序产品

AITNT
正文
推荐专利
大模型训练方法、装置、设备、存储介质及程序产品
申请号:CN202510513698
申请日期:2025-04-23
公开号:CN120387531A
公开日期:2025-07-29
类型:发明专利
摘要
本申请涉及联邦学习技术领域,提供一种大模型训练方法、装置、设备、存储介质及程序产品,该方法包括:在大模型联邦训练的每个通信轮次中,接收各参与方发送的因子矩阵;因子矩阵是由参与方对随机选择的局部向量因子进行局部迭代优化得到的,局部向量因子是对参与方本地的局部大模型的张量适配器的权重矩阵进行张量分解得到的;根据因子矩阵更新与随机选择的局部向量因子对应的全局向量因子,供各参与方更新本地的局部向量因子,完成一次联邦迭代。通过张量分解和对训练参数的随机选择,减少了计算资源的消耗和通信开销,并且,避免了误差项的叠加,缓解了数据异质性导致的模型收敛速度慢的问题,减少了大模型的训练时长,提高了训练效率。
技术关键词
模型训练方法 因子 矩阵 多层感知机层 索引 适配器 非暂态计算机可读存储介质 联邦学习技术 模型训练装置 处理器 计算机程序产品 编解码器 注意力 存储器 电子设备 模块 数据 样本 误差
系统为您推荐了相关专利信息
1
一种大气复合污染物健康影响评估方法、装置及预警系统
时间序列数据库 空气质量健康指数 预警系统 层次结构模型 层次分析法
2
基于GPU加速的隐式地质建模方法、系统和设备
网格 地质建模方法 矩阵 颜色 元素
3
面向多设备协同的星闪连接抗干扰动态优化方法
动态优化方法 多设备协同 协同通信 数据分析模型 模糊逻辑
4
静态随机存取存储器存内计算系统及方法
神经网络模型 SRAM存储阵列 SRAM存储单元 元数据存储器 模式
5
基于模糊逻辑模型的核电取水口生物群落变化预测系统
监测点 模糊逻辑 预测系统 模糊隶属度 子模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号