摘要
本发明公开了基于双层强化学习的源荷储动态策略验证方法,包括如下步骤:S1、采集源荷储系统的运行数据,构建标准化运行数据集;S2、构建双层强化学习模型,上层策略网络生成全局调度策略,下层策略网络输出动作决策策略;S3、采用策略梯度优化方法对双层强化学习模型进行联合训练,输出调度策略;S4、引入积分梯度方法对调度策略进行分析,构建关键调度状态节点集合;S5、对全局调度策略的生成逻辑进行优化,获得优化后双层强化学习模型;S6、构建多个源荷储系统运行场景,形成典型运行场景集合;S7、在典型运行场景集合中部署优化后双层强化学习模型,输出策略验证结果。本发明通过结合双层强化学习与积分梯度方法,实现源荷储动态策略验证。
技术关键词
策略
强化学习模型
验证方法
储能荷电状态
场景
网络优化
可再生能源
初始荷电状态
梯度方法
动态
门控循环单元
负荷
数据
储能系统
演化特征
多层感知机
输入结构
决策
索引
系统为您推荐了相关专利信息
数字孪生模型
智慧工地
强化学习算法
管理方法
创建工程项目
训练数据生成方法
多分支
动态
强化学习算法
约束工具
变压器绕组
监测预警方法
多维特征向量
胶囊神经网络
统计特征