摘要
本发明公开了一种基于深度强化学习和深度学习的自动驾驶决策规划方法,其基于经过训练的深度强化学习网络实现;深度强化学习网络包括Actor网络、TIN网络、Critic网络和车辆轨迹预测网络;该方法在深度强化学习的基础上引入了任务重要性与车辆轨迹规划方法融合的决策规划算法,考虑了驾驶环境状态对当前动作决策的重要程度,并建立基于任务重要性的网络结构,实现在训练进程中逐步更新;在规划层次基于轨迹预测,引入奖励函数与网络中环境信息融合,实现在行驶决策效果上具有通行时间更短,安全性更高,相比现有算法提高了收敛速度和收敛效果,提升了决策规划系统的效率、安全性和舒适性,为自动驾驶公路驶出决策机理和评估等研究提供一种方案。
技术关键词
深度强化学习
决策规划方法
表达式
车辆轨迹预测
批量
车辆运动信息
场景特征
车辆轨迹规划方法
场景交互系统
定义
网络训练方法
速度
方向盘
车道变换
规划算法
系统为您推荐了相关专利信息
积累方法
表达式
粒子
匹配滤波器
构建状态转移模型
平衡独轮车
反作用飞轮
强化学习策略
多模态
驱动轮电机
网络构建方法
数据立方体
传感器
校验算法
冗余特征
联合调度方法
数据处理中心
地面设备
多波束
训练数据量