摘要
本发明涉及一种基于深度强化学习的复杂交通场景混合动力汽车经济性驾驶策略,属于新能源汽车领域。该方法包括:构建具有交互性的多车道多交通信号灯训练场景:使用车辆运动学模型描述训练场景中车辆的纵向运动,将车辆的换道过程简化成一个瞬态过程,并利用基于规则的决策模型控制其他车辆,使环境具有交互性;构建基于最大熵深度强化学习的决策模型,包括状态空间、动作空间、奖励函数、策略模型、评价模型与经验回放池;构建目标车辆安全约束,包括纵向加速度安全约束以及横向换道决策安全约束,用于避免车辆发生碰撞和违反交通规则等危险行为;训练基于最大熵深度强化学习的决策模型。本发明利用深度强化学习提高了自动驾驶汽车的经济性。
技术关键词
深度强化学习模型
新能源汽车
车道
加速度
车辆运动学模型
决策
梯度下降法
训练场景
交互性
策略
交通信号灯信息
交通灯信息
交通流信息
混合动力汽车
系统为您推荐了相关专利信息
汽车主动悬架系统
状态空间方程
状态空间模型
柔性
阶滤波器
深度学习模型
路面摩擦系数
分析方法
数字孪生模型
图像
加速度
偏差
控制挖掘机
IMU坐标系
计算机执行指令
动力学数学模型
变量
车辆控制方法
序列
行驶状态信息