摘要
本发明提出了一种自动驾驶车辆位姿估计方法。首先,利用汽车摄像头获取道路彩色图片,并结合3D汽车模型输入至基于Mask‑RCNN的网络,得到汽车实例图像和3D点云。然后,通过PSPNet和PointNet++网络提取特征,再利用Transformer融合模块和FSAM、FCAM模块进行特征融合,得到全局特征。同时,使用ResNet‑1网络GSENet和PointNet++网络提取3D汽车模型的全局和类别级特征。将这些特征输入自适应模块,得到新的全局特征,并与实例全局特征融合,生成注意力矩阵。最后,利用基于Transformer的注意力模块和注意力矩阵对先验点云进行变形,以估计车辆位姿。这种方法能有效提取汽车的局部和全局特征,并通过特征融合和注意力矩阵提高位姿估计的准确性。
技术关键词
车辆位姿估计方法
注意力
汽车摄像头
全局特征融合
汽车模型
模块
图像
语义特征
网络
矩阵
解码器
编码器
点云特征
编码特征
通道
物体
视角