一种基于二阶矩阵优化的大模型训练方法

AITNT
正文
推荐专利
一种基于二阶矩阵优化的大模型训练方法
申请号:CN202510291568
申请日期:2025-03-12
公开号:CN120124701A
公开日期:2025-06-10
类型:发明专利
摘要
本发明公开了一种基于二阶矩阵优化的大模型训练方法,属于深度学习模型训练技术优化领域,一种基于二阶矩阵优化的大模型训练方法包括以下步骤:S1.分解二阶矩阵为行列向量,滑动平均与分布式分块降低存储;S2.行梯度聚合结合历史衰减因子生成统计行向量;S3.列方向分块分布式统计并跨设备同步生成列向量;S4.行列向量外积构建低秩矩阵,噪声抑制提升估计精度;S5.动态稀疏采样,初期高密度聚焦,关键层稳定采样率;S6.采样点执行时序衰减更新,异步计算提升资源利用率;S7.未采样区域高斯核平滑邻域值补偿覆盖间隙;S8.融合低秩估计与稀疏数据,自适应权重平衡全局精度;有益效果包括降低显存占用、提升分布式计算效率及平衡训练精度与速度。
技术关键词
模型训练方法 矩阵 向量生成方法 噪声抑制 分块 分布式统计 演化特征 采样率 参数 深度学习模型训练 邻域 连续性 时序 因子 动态 隐藏技术 权重机制 同步协议 噪声误差
系统为您推荐了相关专利信息
1
一种基于深度压缩感知的联合信源信道编码方法及系统
迭代收缩阈值算法 图像块 协方差矩阵 符号 信噪比信息
2
基于数据驱动的非零和博弈多能源系统调度方法和装置
内模系统 多能源系统 控制策略 多项式 参数
3
一种近距离毫米波MIMO雷达的目标平动补偿及三维成像方法、系统
运动补偿 MIMO雷达 回波 三维成像方法 三维成像算法
4
一种基于SIP消息自适应流量分析的网络QoS评估方法、系统、设备、介质
流量特征信息 计算机程序指令 概率密度函数 网络 消息
5
一种基于人工智能的智能电动床调节方法及系统
生理状态信息 控制设备 深度睡眠状态 智能电动床 神经网络模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号