摘要
本发明公开了混合强化学习交通信号分层控制方法,采集各交叉路口上游车道和下游车道的队列长度,利用上游车道的队列长度和下游车道队列长度对应的加权和获取相位压力值,将队列长度和相位压力值结合得到本地交通数据。在未检测到拥堵或紧急车辆时,利用多个底层最大压力控制器经最大压力算法和本地交通数据获取交叉路口各自对应的最优相位来控制各交叉口的交通信号。整合各交叉路口的本地交通数据得到全局交通数据,经图神经网络对全局交通数据编码,全局近端策略优化控制器通过编码后的特征学习出全局最优策略。在检测到拥堵或紧急车辆时,全局近端策略优化控制器利用全局最优策略对当前相位调整,将调整后的相位下发各交叉路口控制交通信号。
技术关键词
交叉口
队列
分层控制方法
压力控制器
绿波协调
策略
车道
交通
车辆
拥堵指数
算法
数据编码
矩阵
终点
参数
决策