摘要
本申请涉及一种基于柔性伸缩网络重构的电力系统迁移强化学习调度方法,其中,方法包括:确定电网正常拓扑运行场景下目标电力系统调度模型的状态空间、动作空间和目标奖励函数,以根据状态空间、动作空间和目标奖励函数建立目标电力系统调度模型;基于预设的深度确定性梯度算法,训练目标电力系统调度模型对应的目标电力系统调度智能体;在电网拓扑变化场景下,基于预设的柔性伸缩网络重构的迁移学习策略,对目标电力系统调度智能体进行迁移,以生成迁移强化学习自适应调度策略。由此,解决了现有技术在电网多样运行场景下调度决策模型适应性受限,难以提升电力系统调度的效率和可靠性等问题。
技术关键词
强化学习调度方法
迁移学习策略
梯度算法
发电机组
电力系统
重构
场景
柔性
重放机制
神经网络参数
计算机程序产品
处理器
调度装置
表达式
可读存储介质