摘要
本发明公开了基于动作调整强化学习的综合能源系统低碳优化调度方法。该方法首先基于EH耦合模型建立综合能源系统的碳排放流模型,以系统运行成本和碳交易成本最小为目标。设计强化学习以t时刻系统的已知状态量作为状态空间,日内各设备出力作为动作空间,设计奖励函数包括成本奖励和违反系统约束惩罚。在前期探索阶段,使用策略网络针对当前系统状态输出动作,更新网络参数。当训练测试达到预设阈值时,进入动作空间调整阶段,根据约束条件对t时刻策略网输出的动作进行调整,并将动作偏移量的正则项引入策略网络的损失函数中。使用更新后的网络对综合能源系统进行低碳优化调度,输出各设备出力方案。
技术关键词
综合能源系统
低碳优化调度方法
功率
配额
电网售电价格
热电联产装置
端口
天然气
阶段
能源转换效率
吸收式制冷机
密度
电池储能系统
更新网络参数
强化学习算法
设备运行状态
定义策略
系统为您推荐了相关专利信息
混合储能电站
协同优化方法
拉格朗日模型
增广拉格朗日
KKT条件
统计特征参数
地层模型构建方法
地震
滑动窗
功率
两阶段随机优化
可再生能源出力预测
场景
拉丁超立方抽样
居民
电流控制模块
组网系统
换流器
无功功率控制
电压控制模块
配电网调度优化
配电网调度方法
故障场景
充电站
有功功率