摘要
一种基于集中训练、分散执行的多智能体Actor‑Critic交通信号协同控制方法,涉及人工智能领域。在城市交通网络中,每个交叉口智能体分配一个分布式Actor网络和一个集中式Critic网络。在集中训练阶段,智能体之间通过发送各自的局部交通状态、局部奖赏等信息,实现信息共享,形成对全局交通状态的感知。集中式Critic网络根据聚合的全局交通状态和奖赏信息,评估分布式Actor网络的控制策略效果,并指导Actor网络学习如何在动态时变的交通环境中通过共享信息和协同决策最大化交通网络的整体性能;在分散执行阶段,分布式Actor网络根据自己的局部观察和训练好的策略选择控制动作。本发明有效提升了多交叉口交通信号控制的智能合作水平和自适应决策能力。
技术关键词
信号交叉口
协同控制方法
分布式智能
控制策略
交通状态信息
平均等待时间
交叉口交通信号控制
交叉口车辆
车道
梯度下降算法
深度神经网络
训练算法
中间层
定义
车辆排队长度
系统为您推荐了相关专利信息
能耗预测模型
全球定位系统
仿真器
实时位置
地图路径规划
电控刹车系统
电机旋转角度
神经网络模型
反馈控制系统
修正方法
分布式账本
智能合约开发
资金
区块链技术
智能合约执行引擎
矩阵
协同控制方法
时间序列预测模型
间隔特征
声波
超级电容器外壳
数字孪生模型
模具系统
智能温控
模具本体