摘要
本发明涉及自动驾驶车辆的决策规划领域,具体涉及一种基于深度强化学习的自动驾驶车辆决策规划方法。所述方法包括步骤:自车在结构化道路行驶的过程中,采集环境车辆的位置信息,将环境车辆历史位置数据引入长短期记忆网络得到周围车辆驾驶意图隐藏状态,根据得到的隐藏状态与自车运动信息融合通过SAC算法生成基于多项式曲线的规划轨迹。本申请解决了深度强化学习用于自动驾驶决策规划领域的安全性和稳定性差的问题,同时降低了强化学习整体训练难度,可广泛应用于自动驾驶决策规划技术领域。
技术关键词
深度强化学习
SAC算法
规划系统
决策规划方法
车辆
概率密度函数
长短期记忆网络
判断周围环境
信息处理模块
运动特征
轨迹
多项式
策略
网络更新过程
输出模块
超参数
优化网络参数
系统为您推荐了相关专利信息
校准方法
大数据
孤立森林算法
异常数据点
充电桩信息
视频智能剪辑方法
视觉显著性特征
多模态
动态时间规整算法
语音
平滑路径规划方法
轨迹
控制机器人运动
表达式
全局规划器
车辆加速度数据
路面轮廓
状态空间模型
扩展卡尔曼滤波
离散状态空间