摘要
本发明提供一种电网调度策略优化方法和装置,方法包括:获取电网系统当前状态数据;将数据输入预先训练的电网调度策略优化模型,获得优化的电网调度策略;模型的构建包括:根据电网调度策略优化目标构建目标函数;根据目标函数构建包括状态空间、动作空间和奖励机制的马尔可夫决策过程;奖励机制包括构造的奖励函数的和设定的奖励内容,奖励函数包括新能源机组消纳奖励、火电机组运行成本奖励、平衡机组出力奖励和辅助奖励;奖励函数的构造包括奖励函数权重系数的设计,奖励函数权重系数在电网调度策略优化模型训练过程中是变化的。本发明能够获得安全实现新能源机组消纳最大化和火电机组总成本最小化的电网调度策略。
技术关键词
策略优化模型
策略优化方法
新能源机组
电网系统
火电
平衡机
周期
机制
策略优化装置
决策
网络
关系
数据采集模块
风电
动态
索引
参数
系统为您推荐了相关专利信息
细胞自动机模型
电网系统
分析方法
节点状态预测
历史运行数据
调峰辅助服务
负荷
火电机组智能
多智能体强化学习
策略优化方法
虚拟同步发电机
电网系统
分析方法
异常数据
电流
微电网系统
状态空间模型
子系统
方程
滑模观测器