摘要
本发明公开了一种用于停车场车位占据检测的3D语义占据预测方法,属于车辆停车检测技术领域。该方法包括以下步骤:通过停车场内的摄像头采集停车场场景的图像数据;从采集的图像数据中提取图像特征,并预测图像中每个像素点的深度信息;根据提取的图像特征和预测的深度信息重建停车场场景的3D占据栅格;在深度引导下的3D占据栅格中,对空间内每个体素进行精确的语义分类/识别,重建出包括遮挡和图像不可见区域在内的复杂的具有语义标签的三维场景;基于重建的三维场景进行车位占据预测,根据占据预测结果识别出车位异常情况。本发明通过结合深度信息和图像特征进行3D重建,能够有效解决基于单目视觉的3D重建方法中存在的精度不足问题。
技术关键词
语义场景
停车场
图像
交叉注意力机制
停车检测技术
语义标签
摄像头内参
输出特征
栅格
像素点
坐标
数据
标记
上采样
非线性
通道