摘要
一种基于自蒸馏的BEV视角3D目标检测方法,应用于自动驾驶的3D目标检测场景,包括:S1,通过环视摄像头采集多视角图像,利用视觉转换模块将图像特征转换成BEV特征图;S2,构建自蒸馏框架,基于BEV特征图,在同一模型上并行生成教师BEV特征和学生BEV特征:S3,将教师与学生BEV特征拼接后输入编码器,计算BEV特征自蒸馏损失LFSD;S4,将当前批次预测的3D边界框定位信息离散化为概率分布,与上一批次生成的软标签概率分布进行KL散度对齐,计算边界框自蒸馏损失LBSD;S5,组合LFSD、和LBSD及目标检测原始损失Loriginal,构成总体损失函数,进行模型优化。本发明通过引入自蒸馏,通过一种更有效的蒸馏算法实现视觉3D目标检测模型的轻量化。
技术关键词
蒸馏
深度图
学生
教师
上下文特征
分支
屏蔽背景噪声
激光雷达点云数据
标签
融合激光雷达
多视角
编码器
算法架构
分辨率
机制
可读存储介质
特征提取器
视觉