模型训练的校正方法及相关设备

AITNT
正文
推荐专利
模型训练的校正方法及相关设备
申请号:CN202411978718
申请日期:2024-12-30
公开号:CN119903892A
公开日期:2025-04-29
类型:发明专利
摘要
本公开提供了一种模型训练的校正方法及相关设备,涉及人工智能技术领域,该方法包括:在大模型的进行迭代训练的过程中,在每次迭代更新时,实时采集多个网络层的网络参数的历史梯度信息;根据所述历史梯度信息,确定校正策略;根据所述大模型的网络层,调整所述校正策略的校正幅度,确定当前次校正的校正幅度;根据所述校正策略和所述当前次校正的校正幅度,对所述大模型的每个网络层的当前梯度信息进行校正,得到校正后的梯度信息。通过监测和分析迭代训练的过程中的历史梯度信息,自适应的校正梯度更新方向和幅度,减少训练后期的震荡和不稳定现象,提高训练的稳定性和收敛速度。
技术关键词
校正策略 校正方法 处理器 曲线 频率 人工智能技术 计算机程序产品 校正单元 校正装置 速率 采集单元 指令 参数 可读存储介质 网络 阶段 电子设备 存储器
系统为您推荐了相关专利信息
1
一种奶牛发情预测方法、服务器、介质和程序产品
奶牛群体 显示端 深度学习算法 服务器 音频特征
2
安全的大模型数据处理方法、系统、装置和介质
词嵌入向量 模型数据处理方法 会话 生成自然语言 模型数据处理系统
3
一种工地物料智能监控方法、装置、设备及存储介质
智能监控方法 图像分割模型 图像采集设备 拉普拉斯 工地
4
搭载红外成像仪的管道行车
红外成像仪 超声波发生器 图像处理器 车架 超声波接收器
5
黑启动电源的电力系统恢复方法、系统、介质及电子设备
电力系统恢复方法 黑启动电源 频率响应 小水电机组 新能源机组
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号