摘要
本发明涉及一种面向匝道汇入场景的自动驾驶分层决策控制方法,属于自动驾驶汽车技术领域,包括以下步骤:S1:构建具有交互性的高速公路平行式匝道汇入场景,使用二自由度运动学模型描述训练场景中车辆的运动,并利用基于规则的智能决策控制模型控制其他车辆,使环境具有交互性;S2:构建基于最大熵深度强化学习的决策模型;S3:构建基于多项式曲线的轨迹规划算法;S4:构建基于匝道场景的动作映射函数及路径跟踪控制模型,将车辆轨迹和动作转换为笛卡尔坐标系,通过PID算法跟踪轨迹以控制车辆运动;S5:训练所述基于最大熵深度强化学习的决策模型。本发明降低了强化学习整体训练难度,提高了自动驾驶汽车匝道汇入的稳定性和安全性。
技术关键词
车辆
轨迹规划算法
深度强化学习模型
路径跟踪控制
多项式
笛卡尔坐标系
深度强化学习算法
交互性
策略
矫正模型
PID算法
指标
梯度下降法
训练场景
决策
加速度
障碍物
系统为您推荐了相关专利信息
电池单体
电池管理系统
控制电路
并联电池组
可变电阻
场景生成技术
无人机巡检方法
三维点云数据
骨架特征
仿真场景
虚拟人物形象
汽车导航系统
惯性导航系统
界面
车辆操作系统
控制策略优化方法
间接式胎压监测
车轮
状态空间模型
控制决策模块
转向助力系统
人机
驾驶辅助系统
车辆方向盘
基础