摘要
本发明提供基于多智能体强化学习和路口重要性的交通信号控制方法,属于交通信号控制技术领域。基于交叉口优先级构建CM‑MG模型,为交通网格中所有智能体设置决策序列;通过GNSD‑Light网络为决策序列中每个智能体选择最佳动作,包括:通过观测表示层获取环境信息;通过前驱动作表示层提取每个智能体的历史动作特征,使成员智能体理解并协作前驱的决策;通过Q输出层顺序输出每个智能体的最佳动作;观测表示层,包括:通过基于相对位置编码的简洁空间处理模块,提取空间特征;通过残差图注意力网络整合邻域观测特征。本发明提高了重要交叉口的通行效率;进而提高了全局交通的通行效率。
技术关键词
交通信号控制方法
多智能体强化学习
交叉口
决策
注意力
交通信号控制技术
动作特征
原始观测数据
节点
BFS算法
网络
网格
编码
序列
多层感知器
矩阵
邻域
残差模块