摘要
基于弹性步长深度Q网络的微电网优化运行方法,包括:构建以运行总成本和环境成本最小化为目标的多目标优化模型;将微电网多目标优化问题转换为马尔可夫博弈过程;结合隐藏特征聚类驱动机制和基于近邻的可变密度聚类算法,设计弹性步长调整机制,根据状态相似性调整深度强化学习的步长,以缓解Q值高估问题;利用ES‑DQN方法对微电网智能体进行优化。本发明所提方法通过结合弹性步长机制与深度强化学习,并利用聚类分析有效判断状态相似性,缓解了传统DQN中的Q值过估问题的同时提高了优化效率,使微电网优化调度更精准。
技术关键词
电网优化运行方法
深度Q网络
微电网
密度聚类算法
储能系统
储能荷电状态
深度强化学习
数据
输出特征
功率
DBSCAN算法
电网优化调度
密度聚类方法
储能额定容量
定义
非线性