摘要
本发明公开了一种基于深度强化学习的高速公路合流区的协同控制方法,建立LiikeSim‑Python联合仿真环境,在仿真环境中设置线圈检测器获取高速公路合流区上下游的交通流数据;采用基于高斯混合分布的EM算法作为交通状态分类器,以高速公路合流区的交通流数据为输入,对高速公路合流区的交通状态进行划分;设计状态空间、动作空间和奖励函数;以高速公路合流区的状态空间作为输入,以可变限速智能体和匝道计量智能体的动作作为输出,构建时序特征下的多智能体共享经验的网络模型;为可变限速和匝道计量智能体分别设置一个独立的经验池,以控制周期为频率收集智能体与交通仿真环境的交互经验;使用抽样样本训练智能体模型;利用训练得到的智能体模型实现高速公路合流区的协同控制。本发明能够降低高速公路合流区交通的行程延误。
技术关键词
高速公路合流区
协同控制方法
线圈检测器
时序特征
仿真环境
车辆排队长度
分类器
训练智能体
交通流状态
智能体模型
网络
交通仿真
路段
深度强化学习算法
数据
协同控制系统
系统为您推荐了相关专利信息
完好性评估方法
置信度评估方法
完好性监测
时序特征
断点
神经网络预测模型
协同控制方法
协议转换设备
数据标签
计算机可执行指令