摘要
本发明涉及一种智能汽车测试场景生成方法,特别涉及一种基于强化学习的智能汽车雨雾测试场景生成方法,步骤包括:测试场景建模、引入价值函数、设置奖励函数、扩散正余弦Q学习。本发明引入连续风险势场奖励重塑方法描述智能汽车在雨雾环境中的连续奖励过程;设计衰减贪心策略提高场景生成方向的随机性;并通过使用正余弦算法对Q‑learning进行初始化,同时增加扩张正余弦算法过程作为逆向课程生成,扩散正余弦Q学习算法在不增加SCA迭代总次数的条件下,通过调整各SCA模块参数使其关注范围逐步扩张并更新Q值作为强化学习的逆向课程,进一步加速测试场景生成算法整体的迭代收敛速度。
技术关键词
测试场景生成方法
智能汽车
交通车辆
余弦算法
贪心策略
代表
差分算法
能见度
强化学习框架
强化学习策略
风险
Q学习算法
时序
强化学习算法
重塑方法
表达式
阶段
生成算法
系统为您推荐了相关专利信息
公共交通车辆
协同优化方法
信号协调控制
交叉口
公交调度技术
操作系统
虚拟机监视器
计算机执行指令
标识
车机设备
强化学习算法
项目调度方法
定义
资源重分配
动态
行驶路径规划方法
无人船
节点
动态更新数据
规划行驶路径
分布式能源网络
网络拓扑
网络节点
功率
移动储能车