摘要
本发明提供了源网荷储协同控制与优化方法,属于电力系统调度领域,包括将源网荷储协同优化调度的数学模型转换为马尔科夫决策过程;构建动作网络和评价网络,将当前时刻状态信息输入动作网络生成调度策略,运行调度策略获得当前时刻经验;判断当前时刻经验的奖励值是否超过动态阈值,若是,将当前时刻经验存入经验池,若否,按照概率随机将当前时刻经验存入经验池;当经验池中经验数量达到预设容量时,更新动作网络参数和评价网络参数,直至达到设定迭代次数,并输出优化后的动作网络参数和评价网络参数;还提供了控制与优化系统;采用选择性经验回收机制,通过设定动态阈值对当前时刻经验进行筛选,帮助算法快速收敛,决策时间大大减短。
技术关键词
网络
参数
数学模型
储能系统
决策
策略更新
可再生能源
负荷需求响应
发电机组
动态
充放电功率
梯度下降法
回收模块
储能设备
火电
储能装置
后系统
样本