摘要
本发明涉及基于改进的深度强化学习单交叉口路口交通灯控制方法,获取当前被控制单交叉路口的当前车辆的密度、当前车辆速度以及当前车辆等待时间,并基于当前车辆的密度、当前车辆速度以及当前车辆等待时间定义智能体状态值S,动作空间A,动作选择策略ε和奖励函数r;创建神经网络和目标网络和经验池E,将智能体状态值S,动作空间A,动作选择策略ε和奖励函数r存储于经验池E中,并从中采样一个批次对创建的神经网络进行训练;将训练后的神经网络的参数更新至目标网络;基于训练后的神经网络和参数更新的目标网络对单交叉口路口交通灯进行控制。引入经验回放机制利用过往的经验,提高了样本的利用率,加快了学习速度,让模型更快的收敛。
技术关键词
路口交通灯
深度强化学习
交叉口
车辆
引入经验回放机制
策略
动作相位
神经网络结构
密度
随机梯度下降
速度
参数
交通道路
表达式
分支
红绿灯
队列
定义
信号灯
系统为您推荐了相关专利信息
SSD算法
车辆图像数据
跳跃结构
注意力机制
多尺度
智能协同决策系统
交通流预测模型
多源异构数据融合
车辆优先通行
动态调整机制
三相全桥模块
电机控制电路
电路保护方法
控制模块
信号