摘要
本发明公开了一种基于强化学习的入口匝道车队汇入方法,包括根据实际场景进行场景建模,设计多种车队规模和车辆速度;设计车辆加减速作为动作选择,改变主路车辆和匝道车辆的运行速度,使匝道车辆选择合适的汇入时机;以总行程时间的变化反映车队汇入效率,根据车辆速度变化、车头时距变化和匝道车辆在加速车道的排队等待时间建立奖励函数,设计动作掩码提高训练效率,使用PPO算法对智能体进行训练,取训练后的深度强化模型作为车辆汇入模型。本发明兼顾主线通行效率较优和匝道车辆排队等待时间较小,使主线通行更加顺畅的同时尽可能减少匝道车辆等待时间,减少匝道车辆汇入对主线造成的干扰。
技术关键词
车辆
排队等待时间
车道
深度强化学习模型
入口
加速度
车头
场景
交通
规模
行程
算法
坡道
策略
指标
定义
系统为您推荐了相关专利信息
图像采集装置
车辆全景影像
车门
后视镜
开度传感器
神经网络模型
车辆运动状态
车辆环境信息
车辆状态信息
能源消耗策略