基于H-PPO分层算法的多自动驾驶车辆的动态行为生成方法

正文

推荐专利

申请号：CN202410720011

申请日期：2024-06-05

公开号：CN118709530B

公开日期：2025-10-14

类型：发明专利

摘要

本发明公开了一种基于H‑PPO分层算法的多自动驾驶车辆的动态行为生成方法，包括：1、模拟十字路口车辆交汇路况，构建仿真场景，并对自动驾驶车辆进行动力学建模；2、根据环境信息，构建状态量，混合动作空间；3、通过设置奖励函数鼓励驾驶车辆与被测车辆之间的交汇博弈；4、构建深度神经网络，初始化深度强化学习参数，训练深度神经网络，产生针对被测车辆十字路口左转工况下，使多辆直行的自动驾驶车辆的决策与动作由神经网络分层输出，使其具有博弈行为，以检验被测车辆针对小概率、高风险的边缘场景的应对能力。本发明使用深度强化学习与博弈性理论，生成被测车辆在十字路口遭遇博弈性交汇场景，以提供构建自动驾驶场景的新方式。

技术关键词

车辆分层算法生成方法构建深度神经网络参数深度强化学习定义策略训练深度神经网络加速度决策动态坐标换道模型场景可读存储介质样本车道

基于H-PPO分层算法的多自动驾驶车辆的动态行为生成方法

站点导航

APP 下载