摘要
本发明属于自动控制技术领域,具体涉及基于多智能体强化学习的城市管道流量优化控制系统。它包括:管网多智能体模型构建部分,多智能体强化学习部分和多智能体优化控制部分;所述管网多智能体模型构建部分,用于为每个管道段分配一个智能体,每个智能体均通过状态空间、动作空间、奖励函数和策略组成的集合来描述;所述多智能体强化学习部分,用于基于非线性流量动力学方程,不断学习和更新每个智能体的Q值;所述多智能体优化控制部分,用于通过策略梯度方法不断优化每个智能体的策略,使得每个智能体的朝向最优控制策略逼近。本发明通过强化学习算法,使得系统能够在复杂多变的环境中,自适应地调整控制策略。
技术关键词
多智能体强化学习
多智能体模型
优化控制系统
梯度方法
管道
非线性
方程
强化学习算法
自动控制技术
因子
邻居
控制策略
定义
基准
能耗
加速度
频率
液体
体液
系统为您推荐了相关专利信息
参数优化控制方法
再生涤纶
反射率
学习混合模型
熔体
智能管道检测机器人
融合双目视觉
环境感知模型
双目视觉模块
障碍物识别
水下管道
检测机器人
伸缩筒
齿轮保护箱
双向电机