摘要
本发明涉及一种基于强化学习的多维自然性驾驶场景生成与仿真测试方法,包括:以动力学特征、规则遵循性、心理特性以及协作方式为基础,结合模糊逻辑分类模型对驾驶行为特性进行量化,构建得到驾驶风格模糊规则;构建驾驶环境并依据驾驶风格模糊规则配置不同驾驶风格的量化特征;利用强化学习算法,基于驾驶环境和不同驾驶风格的量化特征,以驾驶风格模糊规则为目标,根据奖励函数计算不同驾驶场景的奖励以训练更新智能体策略网络,得到训练好的智能体策略网络;训练好的智能体策略网络用于生成多维自然性驾驶场景并进行仿真测试。该方法能够生成覆盖从谨慎型到激进型驾驶的多样化行为模式,获得更加完整和精确的行为特征表示。
技术关键词
仿真测试方法
模糊规则
协作方式
风格
加速度
实时状态信息
车辆运动学
转向角
强化学习算法
场景
指标
网络
车道
风险
策略
模糊逻辑
交通
车辆模型
系统为您推荐了相关专利信息
动态系统模型
非线性扰动观测器
门控循环单元网络
模糊逻辑系统
在线估计系统
轨迹模拟方法
蒙特卡洛
车辆轨迹数据
加速度
数据分布
驾驶员意图识别
人机融合控制
车辆运动状态
方向盘
制动踏板