摘要
本发明公开一种混合交通流路口的多车协同决策方法、装置、介质及产品,涉及多车协同决策技术领域,方法包括:构建了融合智能车之间及智能车与有人驾驶车辆交互的基于序贯博弈的动作滤波器的值分解多智能体深度强化学习模型;训练基于序贯博弈的值分解多智能体深度强化学习模型;将混合交通流中待协同决策的智能车辆的全局状态信息与当前协同决策信息输入至训练好的基于序贯博弈的值分解多智能体深度强化学习模型,确定智能车辆的下一时刻的协同决策信息。通过向值分解多智能体深度强化学习模型中增加基于序贯博弈的动作滤波器,提高了算法的样本效率及收敛速度,降低了智能网联车在混合交通流环境下路口通行碰撞风险,提高路口的交通流效率。
技术关键词
智能车辆
多智能体深度强化学习
混合交通流
全局状态信息
决策方法
前馈神经网络
门控循环神经网络
交互模型
滤波器
交通路口
多车协同
处理器
计算机装置
计算机程序产品
智能网