摘要
本发明公开了基于增强探索回退裁剪强化学习的综合能源系统调度方法。该方法在深度强化学习算法的理论基础上,设计了新的动作选择策略,将Actor网络输出的高斯分布的概率最大值作为动作。在记忆库中的训练样本数量溢出时根据方差剔除偏离的样本。改进了传统PPO算法训练过程中使用的损失函数,包括裁剪函数、优势函数以及策略熵部分,有效提高抽样效率与策略更新稳定性,增强了探索能力,且加快了训练期间模型的收敛速度。将训练后的模型应用在综合能源系统优化调度上,指导综合能源系统中不同子系统的出力,能有效应对可再生能源出力和负荷的波动,并通过实验证明该方法显著提高了综合能源系统优化调度的经济性和低碳性。
技术关键词
综合能源系统
深度强化学习算法
网络
代表
光伏发电机组
热电联产机组
信息熵理论
储能机组
梯度下降法
策略更新
子系统
记忆
可再生能源
燃气锅炉
天然气
电储能
参数
系统为您推荐了相关专利信息
数字信号处理单元
色散补偿模块
分光器
端口识别方法
均衡器抽头系数
交通流量预测方法
多源交通数据
注意力
频域特征
大数据
描述符
图像复原方法
交叉注意力机制
退化特征
训练词向量模型
故障预警系统
智能分析模块
多模型协同
深度自动编码器
数据处理模块