摘要
本申请提供了一种用于自动驾驶的强化学习模型的训练方法及会车方法,该训练方法包括:获取当前仿真环境的初始状态空间参数输入到初始强化学习模型,初始强化学习模型输出控制目标车辆执行的预测动作。基于预测动作和其他车辆的执行动作,确定动作奖励。在控制目标车辆执行预测动作后,获取当前仿真环境的下一状态空间参数。重复执行将下一状态空间参数输入到初始强化学习模型以及后续的过程,直至结束该会车场景的会车过程。基于会车过程中的多个动作奖励,确定奖励函数。基于奖励函数对初始强化学习模型进行训练,得到训练好的目标强化学习模型。
技术关键词
强化学习模型
仿真环境
车辆
参数
场景
指标
车道
策略
训练装置
加速度
尺寸
系统为您推荐了相关专利信息
训练分类模型
图像分类模型
参数
分类方法
分析器
信息统一交互
充电调度方法
行程
车辆
充电调度系统
电网投资预测方法
粒子群优化算法
注意力机制
数据
参数