摘要
本发明公开了一种基於深度强化学习的自动驾驶车辆导航方法,属於车辆自动驾驶技术领域,包括:S1:基於激光雷达和视觉相机采集自动驾驶车辆周围的环境数据并实时构建高清地图;S2:通过深度 Q 网络基於构建的高清地图及车辆的当前状态输出每个潜在动作的 Q 值,选择 Q 值最大的动作最为当前的最优动作;S3:控制自动驾驶车辆不断执行当前最优动作,直至终点,即完成导航;其中,所述深度 Q 网络为预训练的深度 Q 网络,在自动驾驶车辆执行完成每一个动作後,在线学习微调深度 Q 网络。本发明设计深度 Q 网络,将状态-动作数据映射为最优动作策略,能够显着减少内存占用,使其能够适应於复杂驾驶环境。在线学习微调深度 Q 网络,学习边规划机制可持续吸收和内化新经验,实现策略自我完善和演进。
技术关键词
深度Q网络
车辆导航方法
深度强化学习
车辆自动驾驶技术
动作策略
视觉相机
高清
激光雷达
地图
在线
终点
内存
规划
数据
机制
系统为您推荐了相关专利信息
能源管理
切换管理方法
深度强化学习模型
无线传感网络技术
数据
网络流量调度
流量预测模型
优化调度策略
样本
嵌入特征
图案自动生成方法
智能算法
裁剪模板
生成图案
生成对抗网络
需求响应策略
深度确定性策略梯度
激励方法
负荷
交互决策方法