摘要
本发明旨在提供基于博弈‑强化学习协同控制的城市路网子区域划分方法,属于智能交通控制技术领域,通过融合多源交通数据实时获取路网交通状态,建立涵盖交通性能和区域均衡的多目标优化模型,以宏观交通流基本图理论描述子区域交通流关系。在此基础上,将动态划分问题建模为马尔可夫决策过程,设计强化学习算法求解最优区域划分策略。多个区域控制代理以博弈论方法进行协同,采用平均场博弈简化多智能体交互,以策略梯度优化实现各代理策略的实时更新。通过仿真算例验证,本发明方法可根据交通状态变化动态调整区域边界,保持各子区域内部交通流的均衡和稳定,提高整体路网通行效率,显著降低平均延误和车辆停次数,具有良好的实时性和鲁棒性。
技术关键词
区域划分方法
交通状态参数
平均场博弈
宏观交通流
交通流模型
多源交通数据
强化学习算法
路段
策略
智能交通控制技术
浮动车轨迹数据
区域边界控制
决策
车辆
博弈论方法
智能体交互
指标
融合多源
系统为您推荐了相关专利信息
开放控制系统
路段
宏观交通流模型
决策方法
智能交通信息技术
区域划分方法
频率响应
拉普拉斯
新能源电力系统
节点
区域划分方法
采样模块
拼接模块
输出特征
编码模块
工业物联网
平均场博弈
资源调度器
数据采集模块
计算机系统
区域划分方法
拉普拉斯
矩阵
城市道路交叉口
交通检测设备