摘要
本文涉及一种发电机组的控制方法、装置及设备。包括对单一机组的子问题构建状态转移模型,并将拉格朗日乘子对应的各时段惩罚价格作为状态加入模型中。采用强化学习算法,训练每个机组的开关机、功率增减策略;采用代理次梯度方法,对UC问题中耦合不同机组的约束进行松弛,利用代理次梯度方法进行迭代与拉格朗日乘子的更新,其迭代过程中的子问题求解采用训练好的强化学习智能体进行序贯决策,反复迭代直至收敛,得到对偶问题的最优解;将所得的机组组合状态进行可行化操作,对发电机组节点进行控制。本文极大提升代理次梯度方法的计算速度,最终提高发电机组在不同时刻的状态的机组组合问题的计算速度。
技术关键词
发电机组
变量
节点
强化学习模型
构建状态转移模型
因子
线路
功率
拉格朗日
强化学习算法
数据获取单元
计算机设备
开关机
松弛
决策
存储器
控制单元
处理器
策略