摘要
本发明公开一种基于模糊强化学习的交叉口交通信号控制方法,所述方法包括通过设置车辆状态变量、信号灯动作变量以及奖励函数来构建强化学习信号灯智能体;输入到达交叉口的车辆状态数据,并执行模糊推理策略选择输出信号灯动作;得到新的所述车辆状态数据和当前奖励值,并将数据放入经验回放池;待所述经验回放池的数据达到一定容量,抽取一批数据进行训练直至达到停止条件;使用训练好的所述强化学习信号灯智能体进行所述交叉口的交通信号控制。该方法克服了强化学习模型训练难以收敛不稳定的弊端,解决了交叉口车辆等待时间过长的问题。
技术关键词
模糊强化学习
信号灯
车辆状态数据
模糊控制器
模糊推理
隶属度函数
模糊规则
变量
交叉口车辆
强化学习模型
策略
三角形
车道
表达式
定义
检测点
系统为您推荐了相关专利信息
指南针校准方法
比例因子误差
三轴磁力计
广义似然比
模糊集合
动态交通环境
交通信号灯
速度规划方法
道路交通信息
曲线
模糊控制器
PID控制器
智能控制算法技术
数学模型
液压油体积弹性模量
环境智能调控系统
颗粒物浓度传感器
多传感融合
气体成分传感器
模糊集合