摘要
本发明属于场景识别技术领域,公开一种基于状态空间模型的序列多模态场景识别方法。将轨迹中的激光点云和视觉图像联合编码形成多模态序列数据,通过全局描述符编码网络处理为独特的全局描述符,两个轨迹的全局描述符分别作为地图和查询;在查询过程中,通过最近邻搜索算法找到地图中最相似的数据,完成场景识别。本发明提出将激光点云和图像数据进行融合编码,增加数据维度,并压缩数据复杂度。通过基于状态空间模型的单帧模块和序列模块获得全局描述符。单帧模块中的交叉扫描设计提高计算效率,序列模块中的顺序全组合表示策略解决了场景中轨迹变化的位置识别问题。本发明具有计算高效性、高准确率和鲁棒性特点。
技术关键词
状态空间模型
描述符
多模态
激光雷达传感器
序列
网络
数据
场景识别技术
编码
搜索算法
通道注意力机制
模块
扇区
激光点
点云
坐标系
视觉