摘要
本发明涉及交通信号控制技术领域,具体公开了基于强化学习与自注意力机制的自适应交通信号控制方法,所述方法包括基于深度强化学习算法建立马尔科夫决策过程模型以及策略神经网络,基于马尔科夫决策过程模型搭建深度Q网络以及自注意力机制,对策略进行评估并对策略神经网络、编码器和解码器的神经网络进行更新,对神经网络进行多次迭代训练,得到训练后的神经网络模型,根据训练后的神经网络模型,生成实时交通信号控制信号,能够在复杂的交通流中逐步学习最优策略,此外,这种算法采用编码器‑解码器结构,将历史轨迹存储在重放缓冲区中,并使用近端策略优化来更新参数。解决了现有自适应交通信号控制方法由于训练需要大量数据并且需要大量计算资源的难题。
技术关键词
交通信号控制方法
注意力机制
神经网络模型
深度强化学习算法
策略
平均等待时间
车道
深度Q网络
编码器
交通信号控制技术
交通信号相位
多层感知机
决策
车辆
路口信号灯
神经网络参数
解码器结构
交通流
交叉口
系统为您推荐了相关专利信息
容错跟踪控制方法
机械臂系统
事件触发机制
执行器
控制器
神经网络模型构建
异构
空间填充曲线
分析方法
节点
强度计算方法
喷丸设备
参数调节模块
阿尔门试片
残余应力场
桥梁施工监测
异常数据
混沌粒子群优化
识别方法
神经网络模型构建