摘要
本发明涉及交通运输信息工程领域,公开了一种基于深度强化学习的车道级混合车流协同控制方法及系统,该方法考虑了车道间的流量差和速度差,并嵌入深度强化学习的奖惩函数中,根据不同车道的混合车流分布情况,构建车道级双层网络控制策略,让其依据当前车道的车流量、车速及车道之间的相互关系,为每个车道动态生成不同的车辆速度上限,并通过所述深度强化学习模型在每一时刻进行反馈优化,不断适应交通变化状况,从而精确响应各个车道的运行需求,并予以实证研究。所述深度强化学习模型能取得优于基线模型的车道级混合车流协同控制效果,可有效缓解高速公路合流区的拥堵现状,且具有跨场景适用性。
技术关键词
深度强化学习模型
高速公路合流区
协同控制方法
车道
网络控制策略
网络交互系统
神经网络模型
速度
交通
交互机制
决策
仿真平台
仿真环境
双网络架构
智能网联车辆
协同控制系统
动态更新