摘要
本发明涉及基于改进的深度强化学习单交叉口路口交通灯控制方法,获取当前被控制单交叉路口的当前车辆的密度、当前车辆速度以及当前车辆等待时间,并基于当前车辆的密度、当前车辆速度以及当前车辆等待时间定义智能体状态值S,动作空间A,动作选择策略ε和奖励函数r;创建神经网络和目标网络和经验池E,将智能体状态值S,动作空间A,动作选择策略ε和奖励函数r存储于经验池E中,并从中采样一个批次对创建的神经网络进行训练;将训练后的神经网络的参数更新至目标网络;基于训练后的神经网络和参数更新的目标网络对单交叉口路口交通灯进行控制。引入经验回放机制利用过往的经验,提高了样本的利用率,加快了学习速度,让模型更快的收敛。
技术关键词
路口交通灯
深度强化学习
交叉口
车辆
引入经验回放机制
策略
动作相位
神经网络结构
密度
随机梯度下降
速度
参数
交通道路
表达式
分支
红绿灯
队列
定义
信号灯
系统为您推荐了相关专利信息
风险评估模型
多源数据协同
产线
融合规则
关键工艺参数
仿真场景
自动驾驶功能
自动化测试脚本
自动化测试方法
软件