摘要
本发明公开了一种基于多视角的3D目标检测方法及系统,属于计算机视觉技术领域。该方法基于原有的三维目标检测模型PETR进行优化,引入3DRoPE替代原有的3D位置编码方式,并为3D位置信息设置了可学习参数以增强适应性。此外,通过融合多视角相机的位姿几何信息到各视角图像的位置嵌入中,进一步提升了模型处理复杂空间关系的能力。利用NuScenes数据集训练后,此模型能够接收来自多个摄像头的实时图像输入,并输出精确的3D目标检测结果,显著提高了自动驾驶环境中的感知准确性与安全性。
技术关键词
相机
场景
傅里叶变换函数
注意力
融合多视角
图像特征向量
计算机视觉技术
模型训练模块
矩阵
多层感知机
实时图像
编码方法
参数
代表
数据
关系
通道
系统为您推荐了相关专利信息
访问控制方法
动态访问控制
电力
随机森林
大语言模型
影像
深度卷积神经网络
特征提取模块
多尺度特征
血管
医学图像配准方法
图像配准模型
分层特征
融合特征
配准医学图像