摘要
针对传统的数据驱动的区域电网强化学习优化调度场景,提出了一种基于数据智能增强的深度强化学习优化调度策略,即通过基于Wasserstein距离的条件生成对抗网络梯度惩罚方法增强训练数据,不仅为制定更准确、更可靠的电网调度策略提供了更为有效的训练,而且加快了近端策略优化算法的收敛。其结果表明,该方法的调度决策与日后全局信息已知的调度结果更为接近,该策略调度决策显著优于传统方法。本发明解决了现有研究对用于训练模型的历史数据往往难以完整涵盖日内的各种实际场景,或者虽然能够覆盖这些场景,但数据量庞大且混杂,限制了其训练效果的最大化等问题。
技术关键词
优化调度策略
深度强化学习
积层
数据分布
概率分布函数
深度神经网络架构
母线
发电机运行状态
条件生成对抗网络
噪声样本
通道
功率值
机组
负荷
光伏电站
变量
系统为您推荐了相关专利信息
地质灾害勘查
三维地质模型
工程地质
地球物理资料
钻孔
训练样本图像
重构模型
编码器
图像识别方法
数据分布
LSTM神经网络
分类识别方法
可视化模块
图像
图谱
工业机器人协同
深度强化学习算法
策略
模块
决策树算法