摘要
本发明涉及交通控制技术领域,具体涉及一种基于多智能体强化学习的交通信号协同控制方法,包括以下步骤:将路网中的每个信号灯路口建模为一个智能体,构建一个分布式的多智能体控制环境;根据空间相关性将整个路网划分为若干小型子网,并通过邻域信息共享机制将交通信息在子网内进行共享和聚合;利用时空图注意力网络提取交叉口智能体及其邻域中包含时空依赖关系的交通状态特征;定义分布式智能体的交通状态、交通信号控制策略、奖惩函数、网络架构和训练所需的目标函数,对分布式智能体进行联合训练,直至达到训练目标。本发明可提升信号控制智能体对交通流动态的实时感知能力,并增强多智能体间的协同决策能力。
技术关键词
多智能体强化学习
协同控制方法
分布式智能
信号交叉口
邻域
交通特征
多头注意力机制
信号控制交叉口
平均等待时间
信号灯路口
长短期记忆网络
控制策略
注意力神经网络
交通状态信息
交通控制技术
系统为您推荐了相关专利信息
预测模型构建方法
磁共振
组学特征
灰度共生矩阵
线性回归模型
土壤水分反演方法
随机森林模型
加权平均法
土壤水分遥感反演
训练样本数据
数据智能分析方法
复杂度
邻域
中子孔隙度测井仪
数据智能分析系统