摘要
本发明提供一种基于多智能体强化学习的动态交通流分配方法,本发明通过云端‑边缘协同架构实现大规模车辆路径的动态优化与实时响应,包括构建多智能体交通仿真环境,根据实时交通流量分布,通过泊松分布模型生成随机起点的智能体车辆;构建包括道路拓扑编码、当前道路密度、邻域速度均值、目标距离比率、拥堵系数的多维观测向量;采用近端策略优化算法在Ray RLlib框架下对多智能体强化策略网络的并行策略优化;基于路径效率、拥堵惩罚与进度奖励设计多目标奖励机制;根据实时观测状态生成转向决策,并通过博弈论纳什均衡解动态更新车辆行驶路线;当突发拥堵时触发协同应急机制。本发明解决了传统方法路径趋同、响应延迟及次生拥堵问题。
技术关键词
多智能体强化学习
动态交通流
泊松分布模型
并行策略
生成随机
Dijkstra算法
动态更新
交通信号控制系统
分布式强化学习
交通仿真
路径规划决策
车辆优先通行
协同路径规划
策略更新
网络
多智能体协同
系统为您推荐了相关专利信息
模型驱动深度学习
相位解调方法
深度学习网络
强度
深度学习训练
容量配置方法
贝叶斯网络模型
强化学习环境
定义
超参数
分流方法
仿真模型
动态交通流
动态交通分配
分流策略
固态电解质
预测模型构建方法
力学性能表征
伪随机数发生器
立方体