摘要
种基于深度强化学习的极端供需下电力出清方法及系统。首先构建基于发电商侧的行动决策制定行为的马尔可夫决策过程;然后将发电商的物理非凸运行特征纳入考虑范围,建立了计及最大化发电商回报和最大化供需匹配度的双层优化模型;最后采用深度确定性策略梯度算法在连续动作空间中直接优化发电商的行动决策。本发明提出的建模方法符合复杂出清市场的实际情况,能够动态适应电力市场中的剧烈供需波动,使得优化的行动决策更加贴合发电机组的运行特性。尤其在电力市场中供需极度不平衡的情况下,能够更好地适应市场变化,优化电力市场的出清过程。
技术关键词
电力出清方法
深度强化学习
双层优化模型
深度确定性策略梯度
决策
混合整数线性规划模型
混合整数非线性规划
连续动作空间
数据获取模块
建模方法
发电机组
算法
时间差
变量
误差
动态
系统为您推荐了相关专利信息
疲劳特征
强化学习模型
综合评价体系
策略
卷积特征提取
粒子群算法
寻找最优路径
深度强化学习
深度确定性策略梯度
障碍物
多智能体深度强化学习
频率控制方法
深度确定性策略梯度
电力系统频率响应
电力系统环境
网格地图
数据处理单元
浊度
水体
控制水下机器人
自动筛选系统
购物中心
分析模块
购物习惯
会员管理系统