摘要
本发明公开了一种基于多智能体深度强化学习的交通信号优化方法,属于交通信号控制技术领域,包括如下步骤:根据车辆运行数据对车辆进行追踪和轨迹仿真,并构建城市交通仿真模型及各交叉口的交通信号灯对应的强化智能学习体;构建上下文增强状态空间,并对上下文状态空间中的特征参数进行归一化处理,并组合得到实时交通环境状态向量;计算得到拥堵指数自适应奖励;根据启发式奖励塑形方法,定义流量匹配度指标和指示信号周期位置奖励,并结合拥堵指数自适应奖励,得到交通信号优化奖励;根据交通信号优化奖励,采用多智能体双深度Q网络训练强化智能学习体控制交通信号相位切换。本发明解决了复杂场景下交通信号控制灵活性和效率不足的问题。
技术关键词
交通信号优化方法
多智能体深度强化学习
交叉口
深度Q网络
车辆运行数据
交通信号相位
交通拥堵指数
仿真模型
塑形方法
交通信号灯
表达式
指标
交通信号控制技术
交通视频数据
周期
轨迹
系统为您推荐了相关专利信息
深度强化学习
集群
能源交易系统
可信机构
特征值
动态OD估计方法
众包轨迹数据
矩阵
分时段
AVI检测设备
车间调度方法
智能化作业
染色体
训练智能体
决策算法
交通信号控制方法
车道
历史交通数据
交通流模型
注意力机制
风险预测模型
逾期风险预测方法
信用卡
深度Q网络
计算机程序产品