摘要
本发明提供一种基于数据不平衡的电力系统控制方法、装置、设备及介质,涉及电力系统安全运行与控制技术领域。该方法通过将拓扑特征矩阵作为观测状态输入D3QN网络,经目标网络和主网络竞争,以及价值流、优势流网络交互学习,学习最佳紧急控制策略,在训练过程中通过自适应生成对抗网络增强算法处理经验池中的不平衡数据,并辅以经验回放机制,形成电力系统控制方法。本发明能够对强化学习经验池进行自适应的数据扩充,同时搭配经验回放机制,加快强化学习的训练进程。此外,还能捕捉电力系统拓扑结构在时空维度的关联,提取关键特性,可适应电力系统中各类故障场景,具备较强的适应性,能够给出高效且经济的电力系统紧急控制低压减载策略。
技术关键词
电力系统控制方法
电力系统紧急控制
节点特征
紧急控制策略
电力系统低压减载
拓扑特征
电力系统拓扑结构
矩阵
生成对抗网络
卷积神经网络提取
动作策略
故障场景
电力系统控制装置
初始化系统
数据
电压
系统为您推荐了相关专利信息
信息识别方法
节点特征
邻居
多头注意力机制
模型训练模块
调度规划方法
车辆路径规划
多维特征向量
多智能体强化学习
节点特征