摘要
本发明公开了一种基于深度强化学习的自动驾驶车辆导航方法,属于车辆自动驾驶技术领域,包括:S1:基于激光雷达和视觉相机采集自动驾驶车辆周围的环境数据并实时构建高清地图;S2:通过深度Q网络基于构建的高清地图及车辆的当前状态输出每个潜在动作的Q值,选择Q值最大的动作最为当前的最优动作;S3:控制自动驾驶车辆不断执行当前最优动作,直至终点,即完成导航;其中,所述深度Q网络为预训练的深度Q网络,在自动驾驶车辆执行完成每一个动作后,在线学习微调深度Q网络。本发明设计深度Q网络,将状态‑动作数据映射为最优动作策略,能够显著减少内存占用,使其能够适应于复杂驾驶环境。在线学习微调深度Q网络,学习边规划机制可持续吸收和内化新经验,实现策略自我完善和演进。
技术关键词
深度Q网络
车辆导航方法
视觉相机
深度强化学习
场景语义分割
风险评估模型
车辆自动驾驶技术
车辆环境数据
融合激光雷达
高清
模态特征
SLAM算法
多头注意力机制
地图
在线
动作策略
贪心策略
传播算法
系统为您推荐了相关专利信息
深度强化学习
诊断方法
数据传输延迟
时延
数据传输能耗
能量管理策略
深度强化学习模型
混合动力车辆
网络
层次聚类算法
ELM神经网络
输电线路设备
输电线路系统
平行控制方法
深度强化学习
无人机
深度强化学习
决策方法
LSTM模型
预训练模型