摘要
本公开提出一种基于分层强化学习的自动驾驶无信号交叉口决策生成方法,涉及车辆驾驶决策技术领域。方法包括:获取自车和对向来车所在的真实驾驶环境;所述驾驶环境包括环境观测值和动作空间;将真实驾驶环境输入路径决策模块,得到决策轨迹;将决策轨迹输入速度决策模块,得到决策速度;所述路径决策模块和速度决策模块基于模拟驾驶环境、自车轨迹、结束条件和奖励函数进行训练;自车根据决策轨迹和决策速度执行左转任务。将速度决策和路径决策分别训练,可使速度决策模型专注于学习如何根据当前环境和其他因素选择最佳左转加速度,而路径决策模型则专注于找到可完成穿越的合适半径,提高模型性能以及生成决策的准确性。
技术关键词
无信号交叉口
决策生成方法
分层强化学习
模拟驾驶环境
轨迹
速度
模块
交叉点
无碰撞
处理器
坐标系
生成系统
计算机设备
算法
可读存储介质
存储器
参数
数值
运动
系统为您推荐了相关专利信息
轨迹预测方法
模式
车辆
计算机程序产品
轨迹预测装置
路径规划导航系统
农业机械
采样点
层级
农田边界
高空带电作业机器人
机器人本体
侧部
伞齿轮
滑动架
空天地一体化
数据收集方法
节点
联合优化算法
能耗