摘要
本发明涉及一种面向动态交通环境的强化学习多车道驾驶决策方法,包括:利用多车道驾驶决策的场景中状态空间、动作空间和轨迹采样信息建立决策神经网络模型;利用综合奖励函数对所述决策神经网络模型进行强化学习训练;通过车辆配备的传感器数组对周围环境进行连续而深入的感知,捕获感知的环境信息;将感知的环境信息输入到所述决策神经网络模型中,决策神经网络模型根据当前的环境信息预测一段时间内的车辆轨迹和推荐的驾驶操作;将决策神经网络模型输出的推荐驾驶操作转化为具体的控制指令,并将指令发送至车辆的线控底盘和执行器。通过本发明方法使车辆可以实现多车道自动驾驶,而无需依赖外部数据和高精度地图,提高了系统的独立性和稳定性。
技术关键词
动态交通环境
驾驶决策方法
轨迹
车辆
线控底盘
神经网络模型训练
强化学习方法
执行器
车身
处理器
车道线信息
双圆法
高精度地图
通信接口
指令
传感器
系统为您推荐了相关专利信息
运动意图
交通
轨迹预测模型
对象
计算机可读指令
清晰化方法
图标
抬头显示模块
图像处理模块
颜色模型
车辆座舱
人机交互方法
卡片
车机屏幕
人机交互系统
智能故障诊断方法
电抗器
故障诊断模型
分布特征
节点特征