摘要
本发明公开一种基于POMDP和Transformer网络的自动驾驶决策规划方法及装置,包括:在线获取与行人交互的当前自动驾驶数据,构建当前POMDP问题的输入序列;将当前POMDP问题的输入序列输入离线训练好的Transformer网络,Transformer网络通过前向推理输出多组横纵向联合决策序列;将Transformer网络输出的多组横纵向联合决策序列转换为多条规划轨迹;将生成的多条规划轨迹进行质量评估,从中选取最优且符合安全要求的规划轨迹作为最终轨迹;若生成的所有规划轨迹均不符合安全要求,则采用现有的POMDP在线优化算法在线进行决策规划。本发明利用POMDP和Transformer网络,结合在线和离线,对自动驾驶决策进行规划,减少传统POMDP在线搜索或迭代的耗时。
技术关键词
决策规划方法
历史位置信息
静态障碍物
道路地图信息
轨迹
动态行人
数学模型
网络
序列
在线
离线
意图
加速度
合规性
数据采集单元
车轮
系统为您推荐了相关专利信息
节能控制方法
纵向动力学
动态规划算法
空气动力学阻力
车辆
气动力
无人机控制方法
采集无人机
无人机控制系统
估计方法
农机轨迹跟踪
非线性模型预测控制
模型不确定性补偿
非线性扰动观测器
事件触发机制
约束跟踪控制方法
双足机器人
虚拟弹簧
伺服控制器
参数