一种基于二阶矩阵优化的大模型训练方法

正文

推荐专利

一种基于二阶矩阵优化的大模型训练方法

申请号：CN202510291568

申请日期：2025-03-12

公开号：CN120124701A

公开日期：2025-06-10

类型：发明专利

摘要

本发明公开了一种基于二阶矩阵优化的大模型训练方法，属于深度学习模型训练技术优化领域，一种基于二阶矩阵优化的大模型训练方法包括以下步骤：S1.分解二阶矩阵为行列向量，滑动平均与分布式分块降低存储；S2.行梯度聚合结合历史衰减因子生成统计行向量；S3.列方向分块分布式统计并跨设备同步生成列向量；S4.行列向量外积构建低秩矩阵，噪声抑制提升估计精度；S5.动态稀疏采样，初期高密度聚焦，关键层稳定采样率；S6.采样点执行时序衰减更新，异步计算提升资源利用率；S7.未采样区域高斯核平滑邻域值补偿覆盖间隙；S8.融合低秩估计与稀疏数据，自适应权重平衡全局精度；有益效果包括降低显存占用、提升分布式计算效率及平衡训练精度与速度。

技术关键词

模型训练方法矩阵向量生成方法噪声抑制分块分布式统计演化特征采样率参数深度学习模型训练邻域连续性时序因子动态隐藏技术权重机制同步协议噪声误差

系统为您推荐了相关专利信息

一种基于深度压缩感知的联合信源信道编码方法及系统

迭代收缩阈值算法图像块协方差矩阵符号信噪比信息

基于数据驱动的非零和博弈多能源系统调度方法和装置

内模系统多能源系统控制策略多项式参数

一种近距离毫米波MIMO雷达的目标平动补偿及三维成像方法、系统

运动补偿 MIMO雷达回波三维成像方法三维成像算法

一种基于SIP消息自适应流量分析的网络QoS评估方法、系统、设备、介质

流量特征信息计算机程序指令概率密度函数网络消息

一种基于人工智能的智能电动床调节方法及系统

生理状态信息控制设备深度睡眠状态智能电动床神经网络模型

一种基于二阶矩阵优化的大模型训练方法

站点导航

APP 下载