摘要
基于深度强化学习的交通信号灯自适应配时控制方法,包括如下步骤:基于预先构建的城市交叉口模型获取实时交通状态;基于实时交通状态通过预先训练好的基于深度确定性策略梯度算法的交通信号控制模型生成理论最优动作,理论最优动作包括多个与交通信号灯一一对应的单体动作,单体动作包括动作状态和动作存续时长;将理论最优动作与预先确定的标准动作区间进行比较,并且根据比较结果对理论最优动作进行修正得到实际最优动作;基于实际最优动作对交通信号灯进行控制。本发明提供一种基于深度强化学习的交通信号灯自适应配时控制方法及系统,能够更加灵活和精确地对交通信号灯进行控制。
技术关键词
交通信号灯
深度强化学习
交叉口
网络
理论
控制方法系统
车道
单体
数据采集模块
样本
噪声
算法
输出模块
车辆
策略
矩阵
参数
系统为您推荐了相关专利信息
数据采集功能
数据处理功能
无线通信网络
动态资源调度
无线通信系统
反馈控制回路
实体
事故现场
系统模块
计算机执行指令
振动特征
设备组
检测头结构
红外图像特征
三维虚拟模型
分布式训练方法
节点
分布式训练系统
辅助线
数据更新