摘要
本发明涉及一种基于深度强化学习的自动驾驶车辆决策的方法和装置,属于智能驾驶技术领域,其中,该方法包括:获取目标车辆的环境信息;基于环境信息以车辆的速度最大化为目标构建换道效益函数;基于换道效益函数构建的横向决策控制模型,基于第一预设深度强化学习算法对所述横向决策控制模型进行训练,得到选择换道动作的价值;构建目标车辆的纵向决策控制模型,基于第二预设深度强化学习算法对纵向决策控制模型进行训练,处理跟驰决策并输出连续车速控制;对横向决策控制模型和纵向决策控制模型根据记忆池存储的经验进行耦合模型训练,得到目标车辆的驾驶决策。本发明通过换道效益函数对换道效益进行量化,从而提高了自动驾驶车辆行驶的效率。
技术关键词
深度强化学习算法
车辆
车道
决策
加速度
车头
智能驾驶技术
定义
存储器
记忆
表达式
代表
输出模块
处理器
电子设备
程序
系统为您推荐了相关专利信息
抽水蓄能电站
智能调度方法
高斯混合模型聚类
抽蓄电站
智能进化算法
自动调控方法
机器学习模型
策略
自动调控系统
模式
局部路径规划方法
人工势场
斥力势场
轨迹
障碍物
室内定位方法
步长估计
图书馆
加速度
信道状态信息估计
控制操作方法
集控室
视觉伺服控制
深度学习模型
操作界面