摘要
本发明提供一种新能源电网前瞻调度方法及装置,涉及电力系统日内经济调度技术领域。本发明首先构建前瞻调度的机会约束最优潮流模型,分析新能源不确定性对机会约束的影响,并建立前瞻调度的约束马尔可夫决策过程,然后利用拟合风险函数概率分布的风险评价器网络和计及极端场景性能的动作器网络,增强智能体对含新能源极端爬坡事件的前瞻调度场景处理能力,最后在电网前瞻调度离线仿真环境中利用模仿学习技术加速智能体的训练。本发明能兼顾前瞻调度的双层鲁棒优化模型的求解速度与策略鲁棒性和安全性。
技术关键词
新能源电网
鲁棒优化模型
评价器
强化学习方法
发电机组
神经网络参数
策略
风险
仿真环境
更新网络参数
爬坡事件
概率密度函数
拉格朗日
算法框架
SAC算法
新能源机组
经济调度技术
功率
决策