基于深度强化学习和确定性策略梯度算法的水库多目标优化智能调度方法

正文

推荐专利

申请号：CN202510940749

申请日期：2025-07-09

公开号：CN120430478B

公开日期：2025-10-03

类型：发明专利

摘要

本发明属于水库优化智能调度领域，具体提供一种基于深度强化学习和确定性策略梯度算法的水库多目标优化智能调度方法，包括收集目标水库的原始水文数据和水库特性曲线；建立包括目标函数和约束条件在内的多目标优化调度模型；将多目标优化调度模型映射为马尔科夫决策过程，建立相应的强化学习环境；选择深度强化学习确定性策略梯度算法与环境进行交互训练，搭建水库多目标优化智能调度模型；通过水库多目标优化智能调度模型对水库进行多目标优化智能调度。该方法解决了现有技术中深度强化学习方法普遍采用固定权重设计激励函数，导致所学习的调度策略灵活性不足，难以根据环境状态实现各水库调度目标的实时动态协调优化的问题。

技术关键词

确定性策略梯度智能调度方法水库智能调度模型优化调度模型在线算法水文深度强化学习方法 Softmax函数水量强化学习环境更新网络参数神经网络参数定义神经网络训练

基于深度强化学习和确定性策略梯度算法的水库多目标优化智能调度方法

站点导航

APP 下载