摘要
本发明公开一种基于可解释性安全强化学习的光储充配电网优化决策方法,步骤是,构建光储充配电网有功/无功优化决策的马尔科夫决策过程MDP及配电网的不确定性运行环境;根据所构建的MDP,通过MIP‑CDQN算法对DRL智能体进行训练,首先收集经验轨迹,然后更新actor深度神经网络和critic深度神经网络的参数,最后将训练好的critic深度神经网络进行保存;将训练好的critic深度神经网络的动作选取过程转化为一个可求解的混合整数非线性规划模型;将所述模型部署到配电网中进行在线优化,根据配电网的实际运行状态对模型进行在线求解以获取满足约束的最佳控制策略。此种方法不但可以面对PV和EV功率的不确定性时给出良好的决策方案,还能在执行阶段满足配电网运行的实时约束。
技术关键词
深度神经网络
优化决策方法
有功功率
轨迹
代表
神经网络参数
混合整数非线性规划
节点
充放电功率
光储充
控制策略
变量
在线
储能
支路
系统为您推荐了相关专利信息
新型配电系统
分布式资源
一体化系统
服务装置
监测设备
循环流化床床温
残差神经网络
智能预测方法
物理
数据
机械臂系统
四足机器人
强化学习网络
轨迹规划器
轨迹优化算法
检测跟踪方法
匈牙利算法
注意力
状态更新
检测跟踪系统