摘要
本发明公开了一种基于深度强化学习的电网稳定风险智能边界决策方法,属于电力系统控制技术领域。该方法构建一个行动者‑评论者模型,在离线阶段通过与电网仿真环境交互进行训练,训练中采用一个融合了边界邻近度奖励、失稳风险惩罚和经济成本的混合奖励函数来优化决策策略。在线应用时,仅需部署训练收敛的轻量级行动者网络,接收实时的电网状态向量,即可快速输出最优的决策动作向量,从而确定兼顾安全与经济的智能稳定边界。本发明实现了决策过程与复杂仿真的解耦,具有决策速度快、自适应性强的优点,能够在保障系统安全的前提下,显著提升电网的运行经济效益。
技术关键词
深度强化学习
决策方法
电网仿真
风险
失稳判据
电力系统控制技术
动态无功补偿装置
发电机无功出力
电网控制系统
拓扑结构数据
交互式平台
保障系统安全
离线
有功功率
训练算法
在线
网络部署
系统为您推荐了相关专利信息
医疗器械管理方法
牙科器械
牙科治疗
Copula函数
粒子群优化算法