摘要
本发明提供一种多智能体图强化学习驱动的主动配电网多时间尺度滚动优化方法,包括以下步骤:划分慢时间尺度设备与快时间尺度设备;将慢时间尺度优化建模为多智能体马尔可夫博弈,定义全局状态空间,以及对应开关动作、无功补偿设备档位与电压调节设备档位的联合动作空间;基于配电网基本回路生成开关动作候选向量,通过排除同一公共支路冲突动作的方案压缩动作空间维度;采用图神经网络拟合各智能体的动作价值函数,根据所述全局状态空间生成降维后的离散动作策略,并通过分布式决策与全局奖励机制协同优化;基于慢时间尺度优化结果,将快时间尺度优化问题转化为混合整数二阶锥规划模型并滚动求解指令。
技术关键词
滚动优化方法
多时间尺度
混合整数二阶锥规划
电压调节设备
无功补偿设备
动作策略
可投切电容器
非暂态计算机可读存储介质
有载调压变压器
静止无功发生器
节点运行状态
开关
档位
微型燃气轮机
有功功率
神经网络参数
配电网拓扑
回路