模型训练的校正方法及相关设备

正文

推荐专利

模型训练的校正方法及相关设备

申请号：CN202411978718

申请日期：2024-12-30

公开号：CN119903892A

公开日期：2025-04-29

类型：发明专利

摘要

本公开提供了一种模型训练的校正方法及相关设备，涉及人工智能技术领域，该方法包括：在大模型的进行迭代训练的过程中，在每次迭代更新时，实时采集多个网络层的网络参数的历史梯度信息；根据所述历史梯度信息，确定校正策略；根据所述大模型的网络层，调整所述校正策略的校正幅度，确定当前次校正的校正幅度；根据所述校正策略和所述当前次校正的校正幅度，对所述大模型的每个网络层的当前梯度信息进行校正，得到校正后的梯度信息。通过监测和分析迭代训练的过程中的历史梯度信息，自适应的校正梯度更新方向和幅度，减少训练后期的震荡和不稳定现象，提高训练的稳定性和收敛速度。

技术关键词

校正策略校正方法处理器曲线频率人工智能技术计算机程序产品校正单元校正装置速率采集单元指令参数可读存储介质网络阶段电子设备存储器

系统为您推荐了相关专利信息

一种奶牛发情预测方法、服务器、介质和程序产品

奶牛群体显示端深度学习算法服务器音频特征

安全的大模型数据处理方法、系统、装置和介质

词嵌入向量模型数据处理方法会话生成自然语言模型数据处理系统

一种工地物料智能监控方法、装置、设备及存储介质

智能监控方法图像分割模型图像采集设备拉普拉斯工地

搭载红外成像仪的管道行车

红外成像仪超声波发生器图像处理器车架超声波接收器

黑启动电源的电力系统恢复方法、系统、介质及电子设备

电力系统恢复方法黑启动电源频率响应小水电机组新能源机组

模型训练的校正方法及相关设备

站点导航

APP 下载