摘要
本发明公开了一种基于自监督学习与知识蒸馏的视觉BEV感知方法及系统,方法包括:(1)自监督学习模块TempoDrive从无标注数据中学习场景结构与物体运动特性,通过知识迁移方法将泛化能力由骨干网络迁移至视觉BEV感知模型;(2)基于多模态知识蒸馏的感知增强模块BEV‑KD将点云前景目标的深度信息传授给视觉感知模型,通过时序融合策略将有效监督区域覆盖率提升,基于可变形注意力特征适配器实现两个模态特征对齐;(3)构建自监督时序知识蒸馏框架VisBEV‑STD,通过三阶段渐进式学习策略,结合TempoDrive和BEV‑KD,弥补纯视觉方案中深度信息缺失问题。本发明解决了纯视觉BEV感知中泛化能力不足和深度信息提取能力不足的关键挑战,在自动驾驶领域中具有显著应用价值。
技术关键词
蒸馏
视觉
融合策略
场景结构
时序
知识迁移方法
点云
特征构建方法
并行神经网络
深度信息提取
特征金字塔网络
覆盖率
多模态
编码生成器
模块
监督学习算法
高精度传感器
语义分割网络
相机
注意力
系统为您推荐了相关专利信息
动态控制方法
调控策略
发酵体系
数据
支持向量机模型
电池片
旋涂设备
钙钛矿太阳能电池
机械臂
加热台
评估分析方法
建筑轮廓
自然景观
颜色
三维信息模型
维修机器人
LED显示屏
除胶机构
涂胶机构
移动机构