一种基于Transformer模型的实时场景理解方法

正文

推荐专利

申请号：CN202410943923

申请日期：2024-07-15

公开号：CN118799713A

公开日期：2024-10-18

类型：发明专利

摘要

本发明属于实时场景理解领域，提供了一种基于Transformer模型的实时场景理解方法，包括：数据采集、数据预处理、数据标注、特征提取、特征融合、语义分割、高维特征提取以及高维特征解码。本发明通过采集图像原始数据、点云原始数据以及环境信息，丰富了识别数据，提高了低光照条件下模型的识别精度；通过图像特征和空间特征融合和语义分割，提高了模型的训练效率。

技术关键词

场景理解方法图像高维特征向量语义分割模型多模态特征环境传感器气体检测传感器三维点云数据声音传感器温湿度传感器解码器物体编码器分类方法像素矫正

一种基于Transformer模型的实时场景理解方法

站点导航

APP 下载