摘要
本发明提供的基于多智能体强化学习的多交通信号灯控制方法及系统,涉及信号灯相位控制技术领域,本发明通过获取多个交叉口的路网结构与预设时段的交通数据,构建各交叉口的智能体,将相邻交叉口的上游路段出口的车流状态作为通信内容,构建多交叉口的状态通信机制;然后结合连续拥堵惩罚项构建目标奖励函数;为每个交叉口构建两个结构相同、参数不同的网络,对所有交叉口执行对应智能体的信号灯协调控制;最后采用损失函数与梯度下降法更新网络参数,直到达到最大仿真次数,得到多交叉口的信号灯相位控制策略。本发明建立了智能体之间的状态通信机制,捕捉相邻交叉口之间的动态车流特征,在实时交通数据下,能有效提升多交叉口区域的通行效率。
技术关键词
多智能体强化学习
路网结构
相位控制模型
车流量数据
信号灯周期
车道
网络
路段
梯度下降法
入口
交通
交叉口协调控制
红灯
相位控制策略
相位控制技术
车辆
系统为您推荐了相关专利信息
路口车流量
注意力机制
MQTT客户端
高斯分布模型
边缘检测
交通流量预测方法
时空融合特征
时序特征
路网结构
语义特征
多智能体强化学习
顺序优化方法
导管
阶段
强化学习模型
车流量数据
充电策略
控制策略
历史负荷数据
蒙特卡洛仿真方法