摘要
本申请提供一种面向复杂环境的三维语义占用感知方法及装置,其中的方法包括:获取当前时刻车辆的全景环视图像,对全景环视图像进行处理,得到三维占用感知结果;对三维占用感知结果进行下采样,得到占用查询结果;利用SAM模型对全景环视图像进行语义分割处理,得到二维语义特征图;利用空间交叉注意力机制对二维语义特征图和占用查询结果进行处理,得到融合的三维体素特征;利用三维解码器和占用头对融合的三维体素特征进行处理,得到全景环视图像的三维语义占用感知结果。本申请的方法能够实现精细化的3D语义占用预测,从而实现对复杂环境中的不规则物体更强的表示学习能力和泛化能力。
技术关键词
全景环视图像
语义特征
交叉注意力机制
坐标系
解码器
可读存储介质
处理单元
感知装置
计算机
处理器
视角
比率
索引
车辆
存储器
编码器
电子设备
系统为您推荐了相关专利信息
特征提取网络
残差模块
图像特征提取
图像高维特征
点云特征
增强型语音
通道注意力机制
TTS技术
速度变化技术
解耦技术
地下管道机器人
自主控制方法
机械夹爪
手眼关系
手眼标定
模型建立方法
数学
训练语料库
可读存储介质
符号