摘要
本发明公开了一种基于视觉激光融合的场景识别方法,包括:获取多源数据,包括LiDAR点云数据和RGB图像数据,并对LiDAR点云数据和RGB图像数据进行预处理;构建场景识别网络,包括图像特征提取网络、点云特征提取网络和特征融合网络,图像特征提取网络用于从RGB图像数据中提取信息生成图像描述符,点云特征提取网络用于从LiDAR点云数据中提取信息生成点云描述符,特征融合网络用于将图像描述符和点云描述符融合输出多模态特征全局描述子,多模态特征全局描述子用于场景识别任务;将多源数据输入训练好的场景识别网络中,输出用于场景识别任务的全局描述子。本方法可以实现异构传感器的优势互补,提升场景识别任务在各种环境下的鲁棒性和准确性。
技术关键词
场景识别方法
特征融合网络
点云特征提取
描述符
图像特征提取
多模态特征
信息生成图像
深度卷积神经网络
视觉
上采样
激光
注意力机制
生成图像特征
数据
系统为您推荐了相关专利信息
高分辨率遥感图像道路提取方法
描述符
解码器
遥感图像处理技术
sigmoid函数
表格
分析方法
LSTM神经网络
图像特征提取
数据获取模块
振动响应预测方法
交叉注意力机制
图像特征提取
时序
车辆行驶路面
原始图像数据
数据采集单元
局部特征描述符
无人机
图像数据处理单元