摘要
本发明涉及一种多时间尺度配电网电压优化控制方法和装置,包括将目标配电网的电压优化问题转化为马尔科夫博弈问题,并建立目标配电网的多时间尺度电压优化模型;利用数据集,求解多时间尺度电压优化模型中的马尔科夫博弈问题,在训练过程中通过正则项的增量学习方法进行训练,得到训练后的多时间尺度电压优化模型;利用多时间尺度电压优化模型输出目标配电网中待调控区域的调整策略,并利用调整策略调控所述待调控区域的电网设备。本发明解决了基于深度强化学习的多智能体配电网电压优化方法不适用于变化的拓扑结构的技术问题,可支持变化的拓扑结构,同时确保智能体在变化拓扑结构下都能保持良好的优化效果。本发明还涉及一种设备和存储介质。
技术关键词
多时间尺度
增量学习方法
配电网拓扑结构
更新网络参数
策略
电网设备
历史运行数据
真空有载分接开关
有功功率
电压优化方法
PV逆变器
样本
调节设备
智能软开关
神经网络参数
深度强化学习
无功补偿器
指数