摘要
本申请提供一种基于多智能体的交互式自动驾驶仿真测试场景生成方法。该方法包括:基于图像数据和度量数据,构建用于模拟作为背景车的车辆的驾驶决策过程的动态驾驶模型;基于层级训练思想和该动态驾驶模型,确定并训练多个交互等级的驾驶策略;构建包括被测车辆以及作为背景车的该车辆的仿真测试环境;根据该动态驾驶模型和该多个等级的驾驶策略,基于该仿真测试环境,为作为背景车的该车辆配置该多个交互等级的驾驶策略,以及,基于多智能体强化学习算法,对作为背景车的该车辆和被测车辆进行联合训练。通过该方法,设计了交互式驾驶策略,使得背景车辆根据实时的仿真环境与被测车辆进行交互。
技术关键词
多智能体强化学习
测试场景生成方法
车辆
策略
动态
图像编码器
神经网络模型
度量
强化学习框架
优化网络参数
长短期记忆网络
决策
数据
生成动作
层级
仿真环境
命令