摘要
本发明涉及车辆控制技术领域,公开了一种车辆控制方法、装置、设备及介质。该方法包括:在第一车辆由匝道汇入主路前,获取主路多个车辆的行驶状态信息;基于多个车辆的行驶状态信息和第一车辆的行驶状态信息,确定多个车辆中是否存在第二车辆;确定基于第一车辆的行驶状态信息和第二车辆的行驶状态信息,无法使当前车辆汇入博弈达到纳什均衡,则通过深度强化学习方法确定第一车辆的目标行驶状态和第二车辆的目标行驶状态;基于第一车辆的目标行驶状态和第二车辆的目标行驶状态,确定当前车辆汇入博弈的最优汇入策略。本发明中强化学习算法的运用可以帮助车辆尽快达到博弈的均衡状态,避免长时间的重复博弈,从而提高道路通行效率。
技术关键词
行驶状态信息
深度强化学习方法
车辆控制方法
智能网联车
矩阵
加速度
纳什均衡策略
车辆控制设备
车辆控制技术
车辆控制装置
强化学习算法
信息处理模块
计算机
激光雷达
处理器
通信设备
系统为您推荐了相关专利信息
无人飞行器
轨迹预测模型
嵌入特征
轨迹特征
隐式特征
故障估计观测器
LSTM神经网络
深度神经网络
航空发动机
矩阵