摘要
本发明公开了一种基于策略梯度算法的储能收益最大化方法,包括如下步骤:采集储能设备状态参数、电力市场实时价格数据和负荷预测数据,并进行预处理;进行特征提取,初始化充放电策略参数,生成初始充放电策略;根据初始充放电策略生成本周期的充放电动作,执行充放电操作,生成充放电反馈信息;计算奖励信号,将奖励信号、储能状态特征向量和充放电动作用于更新充放电策略参数;利用时序依赖关系,对未来周期收益进行反馈优化;进行下层自主策略优化和上层设备间协调,生成全局最优的协同充放电策略。本发明融合策略梯度与图优化方法,实现储能协同控制,具备收益高、适应强与策略稳的优点。
技术关键词
充放电策略
充放电动作
最大化方法
储能设备
梯度算法
设备间协调
周期
时序依赖关系
门控循环单元网络
序列
双向长短期记忆
动态变化特征
参数
信号
滑动时间窗口
数据
双曲正切函数
前馈神经网络
系统为您推荐了相关专利信息
Cu金属间化合物
电子结构
牛顿算法
梯度算法
软件
故障诊断方法
储能设备
遗忘机制
锂离子电池
噪声特征