摘要
本申请属于电网技术领域,更具体地说,涉及基于深度强化学习的虚拟电厂发电计划制定与经济调度方法,本发明分为离线训练和在线执行两个阶段;在离线训练中,通过ε‑贪婪算法平衡探索与利用,结合经验回放机制和目标网络提高数据利用效率和稳定性。同时,目标网络的引入降低了训练过程中的偏差,增强了训练的稳定性。在在线执行阶段,通过将深度神经网络转换为混合整数规划(MIP)模型,实现了对约束条件的严格执行。具体实施中,利用商业MIP求解器,得到最优动作,从而确保调度策略在实际执行中更加准确和合理。该方法在解决电力系统调度问题中具有重要的应用前景,能够有效应对复杂约束条件下的调度需求,提高了系统的稳定性和运行效率。
技术关键词
经济调度方法
DQN算法
深度强化学习
混合整数规划
火电发电机组
储能装置
充放电功率
强化学习网络
可调负荷
引入经验回放机制
计划
储能单元
储能系统
动作策略
采取行动
虚拟电厂系统
系统为您推荐了相关专利信息
运维管理方法
深度强化学习模型
循环神经网络模型
节点
故障预测模型
施工管理方法
计划
实时数据
环境监测设备
强化学习模型
冰壶机器人
冰面
阶段
分层策略
深度强化学习方法
信息安全保护方法
组合优化算法
多层次策略
信息安全保护系统
序列特征
血糖检测方法
强化学习网络
血糖值
动态权重分配
SVM分类器