摘要
本发明属于水电调度运行领域,涉及一种多智能体强化学习驱动的梯级水电随机智能调度方法。步骤包括:步骤一:采用蒙特卡洛前向模拟生成多组径流随机场景;步骤二:基于场景法构建以发电效益最大化为目标的两阶段随机优化模型;步骤三:梯级水电空间维度单智能体强化学习建模;步骤四:梯级水电单智能体求解在时间维度上分解出的两时段子问题;步骤五:提出梯级水电多智能体强化学习逐步优化算法MARL‑POA,部署具有不同策略的强化学习智能体协同优化调度;步骤六:随着可用信息的更新,获得滚动时域梯级水电调度方案。本发明进行了梯级水电优化的时空降维,有效降低计算规模,能够在径流预报不确定下快速动态制定可靠的梯级水电运行计划。
技术关键词
多智能体强化学习
智能调度方法
径流
场景
梯级水电调度
发电量
序列
梯级水电站
蒙特卡洛
Q学习算法
两阶段随机优化
策略
梯级水库调度
净水
强化学习模型
系数方法
系统为您推荐了相关专利信息
语音交互系统
模型驱动方法
后台业务系统
企业
微信号
仿真测试系统
无人农机
测试用例数据
仿真软件
生成测试报告
智能驾驶功能
自动驾驶功能
场景
授权方法
车辆行驶数据
行人特征
行人检测方法
道路场景图像
行人检测模型
融合上下文信息
节点电价预测方法
时间段
电价预测系统
多源融合
场景类别