一种基于Transformer模型的实时场景理解方法

AITNT
正文
推荐专利
一种基于Transformer模型的实时场景理解方法
申请号:CN202410943923
申请日期:2024-07-15
公开号:CN118799713A
公开日期:2024-10-18
类型:发明专利
摘要
本发明属于实时场景理解领域,提供了一种基于Transformer模型的实时场景理解方法,包括:数据采集、数据预处理、数据标注、特征提取、特征融合、语义分割、高维特征提取以及高维特征解码。本发明通过采集图像原始数据、点云原始数据以及环境信息,丰富了识别数据,提高了低光照条件下模型的识别精度;通过图像特征和空间特征融合和语义分割,提高了模型的训练效率。
技术关键词
场景理解方法 图像 高维特征向量 语义分割模型 多模态特征 环境传感器 气体检测传感器 三维点云数据 声音传感器 温湿度传感器 解码器 物体 编码器 分类方法 像素 矫正
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号