摘要
本申请提供一种基于轨迹预测的强化学习自动驾驶决策方法及装置,涉及自动驾驶技术领域。其中方法包括:获取在历史时间段内的自动驾驶车辆与其周围其他车辆的行驶轨迹时序数据;将所述驾驶轨迹时序数据输入训练好的Transformer模型,以对自动驾驶车辆周围其他车辆的行驶轨迹进行预测,得到相应的轨迹预测信息;将所述轨迹预测信息加入到训练好的强化学习模型对应的状态空间中,得到目标状态空间,以使所述强化学习模型基于所述目标状态空间进行自动驾驶决策。可见,本申请在强化学习决策的状态信息中加入其他车辆的行车轨迹预测信息,从而减小自动驾驶车辆与其他车辆发生碰撞的可能性,达到提高自动驾驶决策的通行成功率的目的。
技术关键词
强化学习模型
自动驾驶决策方法
车辆
计算机可读指令
时序
行车轨迹预测
参数
自动驾驶技术
时间段
训练样本集
生成动作
解码器
数据
处理器
网络
编码器
可读存储介质
系统为您推荐了相关专利信息
故障智能分析方法
状态转移模型
图谱
递归神经网络
时序
智能冷藏集装箱
强化学习模型
距离传感器
接触式温度传感器
参数
车辆运行数据
LSTM算法
智能诊断方法
KNN算法
智能诊断系统
文档生成方法
生成模板
计算机可读指令
节点更新
锚点
联合仿真方法
车辆动力学模型
环境感知数据
车辆动力学数据
动态交通流