摘要
本发明提供了一种基于强化学习的能源综合体灵活动态聚合方法及系统,该方法通过工业以太网协议采集能源综合体内电类、气类、热类及多能耦合设备的实时运行参数,运用神经常微分方程过程建模技术构建连续时间动态系统模型,准确描述各类能源资源的非线性动态特性。将聚合过程建模为马尔可夫决策过程,采用改进的孪生延迟深度确定性策略梯度算法训练优化,生成强化学习聚合策略模型。系统通过在线学习更新机制实现自适应动态优化,显著提高可再生能源消纳率和系统运行效率。
技术关键词
策略优化模型
神经网络分类器
深度确定性策略梯度
动态系统模型
流量匹配方法
能源
分布式控制系统
样条
耦合设备
数据分布
燃气轮机模型
建模技术
资源
脉冲
决策
网络结构
微分方程求解器