摘要
一种基于多源多表示信息融合的3D目标检测方法,涉及智能驾驶感知领域。本发明将输入的3D点云数据体素化,通过体素特征编码层实现体素内逐点特征的聚合;使用DeepLabv3模型作为2D骨干网络提取图像特征;提出了图像特征索引方法,对图像特征和体素特征进行对齐,将体素特征和相应图像特征融合得到多模态特征;使用3D稀疏卷积网络从多模态特征中提取深层特征,将深层特征转化为鸟瞰图特征;通过距离投影将输入的3D点云数据转化为距离视图表示,提出了频率感知的自适应扩张卷积网络,从距离图像中提取多尺度特征;将距离特征转化到鸟瞰图,与从多模态特征得到的鸟瞰图特征拼接进行3D目标检测。本发明提升了3D目标检测精度。
技术关键词
距离图像
图像特征索引方法
坐标
多模态特征
多尺度特征
激光雷达
智能驾驶感知
频域特征
3D点云数据
频率
输出特征
网络
平衡特征
图像像素
融合特征
系统为您推荐了相关专利信息
金字塔池化模块
导航线提取方法
残差模块
卷积模块
神经网络对图像
YOLO模型
剪枝方法
检测头
表达式
融合多尺度特征
轨迹预测方法
时序神经网络
终点
轨迹特征
聚类算法