摘要
本发明公开一种基于奖励塑造的电力系统调度智能辅助决策方法,包括以下步骤:1)智能体观察当前电力系统的状态st;2)智能体根据现有策略选择和执行动作at;3)电力系统运行环境向智能体反馈奖励rt,并根据动作at更新状态,得到新的状态st+1;4)定量评估电力系统状态st+1和状态st之间的差异d,以及状态st+1与初始状态s0之间的差异d(st+1,s0)、状态st与初始状态s0之间的差异d(st,s0);5)重塑奖励,得到新的奖励6)智能体根据新的奖励和新的状态st+1更新策略;7)重复步骤1)‑步骤6),生成电力系统调度决策。本发明显著提升了系统的调度性能、适应性和调节能力,为电力系统的安全、稳定、经济运行提供了强有力的技术支持。
技术关键词
智能辅助决策方法
评估电力系统
策略
生成电力
神经网络模型
控制储能系统
风电机组
火电
梯度方法
光伏板
负荷
度量
因子
参数