一种基于强化学习的电力大模型流水线冻结训练优化方法

正文

推荐专利

申请号：CN202410820372

申请日期：2024-06-24

公开号：CN118674003A

公开日期：2024-09-20

类型：发明专利

摘要

本发明提供一种基于强化学习的电力大模型流水线冻结训练优化方法，主要包含两个部分：基于梯度和梯度变化量的冻结决策算法、基于强化学习的冻结训练优化方法。本发明首先设计了基于梯度和梯度变化量的冻结决策算法，以获得良好的冻结判断标准及冻结策略。然后针对如何在训练过程中动态调整冻结判断标准的阈值以适应不同时间点模型状态差异的问题，提出一种基于强化学习的冻结训练优化方法，以梯度变化量、梯度大小及冻结策略实施前后一定训练轮次所需时间等数据为基础，通过强化学习方法动态调整冻结判断标准阈值，从而在加速训练和保障精度中取得平衡，最终提高电力大模型训练效率。

技术关键词

训练优化方法流水线强化学习策略深度学习模型强化学习方法并行训练方法电力调控系统决策算法滑动窗口机制参数强化学习算法生成动作动态网络标记序列精度

系统为您推荐了相关专利信息

一种轻合金铸件探伤拍片、评片及定位打标全流程检测方法

探伤缺陷缺陷探伤探伤拍片轻合金铸件灰度直方图

轧机寿命的预测方法、装置、设备及介质

轧机强化学习模型样本深度学习模型历史运行数据

图像中微小目标物体的位置检测方法、装置、计算机设备、可读存储介质和程序产品

物体位置检测方法卷积神经网络提取图像深度学习模型

一种基于深度学习的脑切片三维重建与跨模态配准方法

切片计算机可读指令荧光深度学习模型非线性配准方法

一种助眠枕

震动装置生物传感器微控制器深度睡眠状态助眠枕

一种基于强化学习的电力大模型流水线冻结训练优化方法

站点导航

APP 下载