摘要
本发明公开了一种基于异步深度强化学习的无信号交叉口车辆协作方法,方法包括:通过制定马尔可夫决策框架来描述车辆在交叉口区域的协同问题,所述系统问题包括观测状态空间、动作空间和奖励函数;基于共享深度神经网络架构设计车辆协作模型,所述共享深度神经网络架构设计的内容包括控制输出策略与值函数估计策略;使用异步训练策略对所述车辆协作模型进行训练;根据训练完成后的所述车辆协作模型对实际场景中的车辆信息进行处理,输出无信号交叉口的车辆协作方案。本发明实施例可在有限的计算资源内,实现车辆在无信号交叉口场景的有效协作,减少车辆堵塞和冲突,提升交通管理的安全性与通行效率,可广泛应用于智能交通技术领域。
技术关键词
协作模型
深度强化学习
车辆
协作方法
无信号交叉口
深度神经网络模型
进程
Actor模型
策略
交叉口场景
更新模型参数
仿真环境
反向传播方法
决策
输出特征