基于H-PPO分层算法的多自动驾驶车辆的动态行为生成方法

AITNT
正文
推荐专利
基于H-PPO分层算法的多自动驾驶车辆的动态行为生成方法
申请号:CN202410720011
申请日期:2024-06-05
公开号:CN118709530B
公开日期:2025-10-14
类型:发明专利
摘要
本发明公开了一种基于H‑PPO分层算法的多自动驾驶车辆的动态行为生成方法,包括:1、模拟十字路口车辆交汇路况,构建仿真场景,并对自动驾驶车辆进行动力学建模;2、根据环境信息,构建状态量,混合动作空间;3、通过设置奖励函数鼓励驾驶车辆与被测车辆之间的交汇博弈;4、构建深度神经网络,初始化深度强化学习参数,训练深度神经网络,产生针对被测车辆十字路口左转工况下,使多辆直行的自动驾驶车辆的决策与动作由神经网络分层输出,使其具有博弈行为,以检验被测车辆针对小概率、高风险的边缘场景的应对能力。本发明使用深度强化学习与博弈性理论,生成被测车辆在十字路口遭遇博弈性交汇场景,以提供构建自动驾驶场景的新方式。
技术关键词
车辆 分层算法 生成方法 构建深度神经网络 参数 深度强化学习 定义策略 训练深度神经网络 加速度 决策 动态 坐标 换道模型 场景 可读存储介质 样本 车道
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号