摘要
本发明涉及一种基于双层自适应深层强化学习的关键边界测试场景生成方法,包括:构造演员‑评论家架构,其中,演员模块包括基于神经网络的自然驾驶行为学习模型以及基于双层自适应深度强化学习的关键边界场景生成模型,评论家模块包括场景复杂度模型以及测试评估模型,在自然驾驶行为学习模型中,利用自然驾驶数据生成背景交通参与者错综复杂的交互行为;利用场景复杂度模型和测试评估模型对生成的场景进行场景复杂度计算和评测,并输出给关键边界场景生成模型;在关键边界场景生成模型中采用双层自适应深度强化学习算法动态增强测试场景的复杂度。与现有技术相比,本发明能够在复杂的多交互高维环境中高效生成真实且多样化的关键边界测试场景。
技术关键词
测试场景生成方法
复杂度
车辆
强化学习策略
识别模块
多模态信息融合
深度强化学习算法
交通灯状态
解码器架构
车道中心线
编码器
轨迹
场景分类
生成场景
动态场景
系统为您推荐了相关专利信息
三相驱动模块
制动电机
电子机械制动系统
电机驱动芯片
电压变换单元
智能应答系统
手持式设备
实时语音
客户
长短期记忆网络
污泥预处理设备
阶段
深度强化学习模型
数据
神经网络模型