摘要
本发明属于实时场景理解领域,提供了一种基于Transformer模型的实时场景理解方法,包括:数据采集、数据预处理、数据标注、特征提取、特征融合、语义分割、高维特征提取以及高维特征解码。本发明通过采集图像原始数据、点云原始数据以及环境信息,丰富了识别数据,提高了低光照条件下模型的识别精度;通过图像特征和空间特征融合和语义分割,提高了模型的训练效率。
技术关键词
场景理解方法
图像
高维特征向量
语义分割模型
多模态特征
环境传感器
气体检测传感器
三维点云数据
声音传感器
温湿度传感器
解码器
物体
编码器
分类方法
像素
矫正