摘要
本发明公开了一种用于自动驾驶测试的车辆危险切入策略构建方法,属于自动驾驶技术领域,其技术要点是:包括以下步骤:步骤一:搭建用于车辆危险切入策略模型训练所需的仿真场景;步骤二:定义车辆危险切入策略模型的状态表示,状态表示由自车、附近车辆、目标点及目标车相关特征共同组成;步骤三:定义奖励函数。奖励函数包括危险切入即时奖励、引导自车危险切入奖励和不当行为惩罚;步骤四:构建车辆危险切入策略模型,策略模型基于TD3构建车辆危险切入;步骤五:训练车辆危险切入策略模型;步骤六:完成步骤五所述的模型训练后,得到车辆危险切入策略模型,模型具有较强的泛化能力、能够应用于不同交通流测试场景的优点。
技术关键词
策略
车辆
仿真场景
自动驾驶技术
网络
测试场景
定义
交通流
车道
参数