摘要
本发明涉及一种互联电网区域奖励函数自主学习的智能发电控制方法,包括以下步骤:实时采集电网运行状态量;将电网运行状态量输入至对应区域的智能体,输出当前时刻的发电调节指令,智能体包括一个控制智能体和一组次优专家智能体,控制智能体采用多智能体深度随机策略梯度算法进行训练,用于根据输入的电网运行状态量输出控制策略,次优专家智能体在训练过程中利用轨迹排序奖励外推算法自主学习当前电网区域的奖励函数,反馈给控制智能体;将发电调节指令作用于控制区域的发电机组,并更新电网运行状态量;以固定周期循环执行上述步骤,实现连续、实时、分布式的智能协同发电控制。与现有技术相比,本发明具有能够自学习建立奖励函数、策略搜索高效等优点。
技术关键词
智能发电控制方法
电网运行状态
控制智能体
轨迹
梯度算法
电力系统环境
控制误差
参数
发电机组
控制策略
深度神经网络
索引
指令
机制
周期
频率
决策