摘要
本发明公开了一种用于单目3D目标检测的数据增强方法及系统,分别构建场景数据库和物体数据库;在场景数据库中随机采样场景,在场景的可达区域中随机采样位置,在物体数据库中随机采样物体,经碰撞,遮挡检测后插入随机采样位置,将物体和场景融合得到重组图像和深度图;基于深度图,将重组图像转换到3D空间,并对相机姿态进行随机扰动,生成不同视角下的训练图像;物体、场景与相机姿态的随机重组合成不断生成的新图像,作为神经网络的训练数据,提升单目3D目标检测模型的性能;本发明能够高效利用已有数据资源,显著提升模型性能;有利于基于相机的场景感知算法在自动驾驶工业界的应用,有利于相关产业的快速落地和发展。
技术关键词
物体
相机
场景深度图
点云模型
神经网络训练
深度值
激光雷达图像
稠密深度图
激光雷达数据
笛卡尔坐标系
纹理
学生
矫正方法
生成场景
系统为您推荐了相关专利信息
矩阵
机械臂基座
机械臂定位方法
加速度
机械臂定位装置
场景理解方法
场景特征
多视角
大语言模型
视觉特征
清洁机器人
视觉算法
深度相机
清洁工具
控制器控制机械臂
状态空间模型
LQR算法
相机
数学模型
状态空间方程