摘要
本发明涉及天然气输送技术领域,具体涉及一种基于深度强化学习的天然气管网优化调度方法,以解决目前天然气调度和深度学习结合形成的调度方法,在面对离散化的连续型决策变量时,出现的调度结果不精确,调度过程经济性差,和模型训练速度慢的问题。本方法包括以下步骤:建立天然气管网调度模型,并将天然气管网调度模型转化为具有管网仿真环境和合理奖励函数的马尔科夫决策过程模型;搭建天然气管网对应的强化学习智能体离线训练环境;构建近端策略优化算法中的批评神经网络模型;利用近端策略优化算法对强化学习智能体进行训练;利用训练完成的强化学习智能体实时获得天然气管网调度的最优策略,并基于获得的最优策略对天然气管网进行实时调度。
技术关键词
管网优化调度
深度强化学习
线性方程求解器
神经网络结构
策略
仿真环境
离线
天然气输送技术
净化站
功能模块
随机梯度下降
算法
优化器
决策
神经网络模型
变量
数据
连续型
开关
系统为您推荐了相关专利信息
深度强化学习
卷积神经网络提取
注意力机制
光伏电站功率预测
门控循环单元
视觉导航方法
特征提取模块
注意力
智能驾驶控制系统
通道