摘要
本发明属于自动驾驶、深度学习、3D占用预测,提供了一种基于2D‑3D联合训练的空间占用估计方法。本发明使用跨模态查询机制,将2D图像的语义特征与3D体素特征进行融合,提升了3D占用预测的精度。通过在2D语义分割和3D占用预测任务之间共享统一的查询参数,方法在保证模型预测准确性的同时,减少了计算量,并增强了模型对复杂场景的泛化能力。本发明通过交叉注意力机制在2D和3D特征之间进行有效交互,从而优化了空间占用的预测效果。该方法特别适用于自动驾驶环境下的实时场景感知任务,提高了在动态环境中对目标空间占用的识别与预测能力。
技术关键词
跨模态
估计方法
交叉注意力机制
多尺度特征融合
像素
图像特征提取
标记
深度图
特征金字塔
查询机制
模块
语义特征
点云
线性
代表
网络
参数
系统为您推荐了相关专利信息
金属横截面积损失
缺陷检测方法
注意力机制
钢丝绳断丝
解释技术
分像素插值方法
多尺度网络
特征融合网络
分辨率
浅层特征提取
铁路有砟道床
脏污
语义分割模型
非易失性存储介质
铁路道床
非线性尺度空间
智能监测提醒
深度神经网络模型
患者
数据