摘要
本发明涉及智能交通控制技术领域,具体是基于时空卷积注意力机制的多智能体交通信号控制方法,将一个区域的多交叉口交通网络建模为多智能体系统,各个多智能体在学习策略过程中同时考虑邻近时刻的相邻多智能体动作的影响,使多个多智能体能协同地进行多交叉口的信号灯控制,建立能够反映当前区域交通网络状态的张量。并将卷积注意力机制融入到深度强化学习神经网络使得智能体能够更好的关注临近交叉口车辆的状态。最后建立基于深度强化学习算法D3QN_CBAM的多智能体交叉口信号控制模型,本发明基于时空卷积注意力机制的多智能体交通信号控制方法,将注意力机制与区域信号控制相结合,提升了区域交通信号协同控制的性能和效果。
技术关键词
交通信号控制方法
深度强化学习算法
交通网络建模
交通仿真
协同控制方法
车道
智能体系统
智能交通控制技术
交通信号控制系统
交叉口信号控制
时空注意力机制
信号协调控制
交叉口信号灯
多智能体协同
车辆排队长度
车辆速度信息