摘要
本发明公开了一种基于多智能体可解释强化学习的停电计划编排方法及系统,方法包括:建立电网仿真环境作为训练多智能体的交互环境;根据当前编排计划可选方案构建智能体的状态空间和动作空间;基于保安全、保供应和保消纳三个优化目标设计各对应智能体的奖励函数;采用基于沙普利值的多智能协作对抗AC强化学习算法并结合电网仿真环境训练各智能体的动作策略;按照设定的比例权重将训练好的各智能体的动作策略进行整合,决策出最终的协作动作策略,从而生成最优的停电计划编排方案。本发明通过多智能体的协作实现兼顾多目标停电计划编排问题,能够更加高效且准确的做出最佳的策略方案,提升电网运行可靠性。
技术关键词
停电计划
动作策略
协作动作
电网仿真
编排方法
编排系统
强化学习算法
智能协作
编码器
电网运行数据
决策树算法
断面潮流
网络
电网运行可靠性
参数
节点
多层感知机
策略更新
系统为您推荐了相关专利信息
电网拓扑结构
仿真模型
电网仿真
电源设备
仿真方法
路径规划方法
深度强化学习
局部路径规划
Dijkstra算法
静态障碍物
配电网故障恢复方法
配电网重构
负荷特征
配电网开关状态
动作策略
编排方法
主特征分析方法
三维显示空间
数据
方程