摘要
本发明涉及流体输配与过程控制技术,旨在提供一种基于强化学习的流体输配管网泵阀联调控制方法。该方法包括:构建基于马尔可夫决策过程的泵阀控制模型,通过引入奖励函数实现三级时间尺度的安全保证;基于Actor‑Critic框架进行深度强化学习,在无需先验模型的条件下通过与流体输配管网的运行环境进行持续交互,使模型在线学习并持续训练至策略收敛;实时采集管网的状态变量并同时作为数字孪生系统和泵阀控制模型的输入,实现泵阀联调和协同控制。本发明能实现泵‑阀系统协同优化控制,避免单独控制带来耦合失调;支持在线学习与策略更新,具备适应动态负载变化能力;节能降耗效果显著,对模型不确定、扰动及延迟具有较强适应性。
技术关键词
数字孪生系统
联调控制方法
阀门
深度强化学习
泵阀
网络评估策略
协同优化控制
云端服务器
连续动作空间
水力
频率
模型误差
框架
策略更新
能耗
阀系统
决策
系统为您推荐了相关专利信息
中继节点
功率分配单元
功率分配方法
全双工系统
信道
筛分设备
深度学习模型
调控方法
实时数据
深度强化学习
消杀机器人
深度强化学习模型
环境感知信息
动态调度方法
消杀剂
序列预测模型
城际网约车
深度确定性策略算法
多智能体强化学习
历史订单数据