一种多智能体强化学习驱动的梯级水电随机智能调度方法

正文

推荐专利

申请号：CN202511449195

申请日期：2025-10-11

公开号：CN120931430A

公开日期：2025-11-11

类型：发明专利

摘要

本发明属于水电调度运行领域，涉及一种多智能体强化学习驱动的梯级水电随机智能调度方法。步骤包括：步骤一：采用蒙特卡洛前向模拟生成多组径流随机场景；步骤二：基于场景法构建以发电效益最大化为目标的两阶段随机优化模型；步骤三：梯级水电空间维度单智能体强化学习建模；步骤四：梯级水电单智能体求解在时间维度上分解出的两时段子问题；步骤五：提出梯级水电多智能体强化学习逐步优化算法MARL‑POA，部署具有不同策略的强化学习智能体协同优化调度；步骤六：随着可用信息的更新，获得滚动时域梯级水电调度方案。本发明进行了梯级水电优化的时空降维，有效降低计算规模，能够在径流预报不确定下快速动态制定可靠的梯级水电运行计划。

技术关键词

多智能体强化学习智能调度方法径流场景梯级水电调度发电量序列梯级水电站蒙特卡洛 Q学习算法两阶段随机优化策略梯级水库调度净水强化学习模型系数方法