摘要
本发明属于三维场景理解领域,提供一种基于多信号解耦的弱监督三维目标检测方法。本发明构建多信号解耦学习框架,利用二维目标框约束、语言模型生成的类别尺寸先验及点云几何信息,分别监督三维边界框的位置、尺寸和朝向。具体包括中心度增强的投影约束模块用于优化目标定位,语义先验锚定模块用于引导尺寸回归,旋转一致性正则化模块用于提高朝向判别能力,同时通过对抗式几何对齐模块动态调整三维框边界。各模块协同训练,无需三维标注,即可生成高质量伪标签用于检测器训练,最终实现了高精度的弱监督三维目标检测方法。
技术关键词
物体
多信号
彩色图像
大语言模型
视锥点云
特征金字塔
尺寸差值
模型框架构建
RANSAC算法
旋转角
检测头
区域生长算法
语义先验
监督算法
旋转误差
对齐模块
场景
相机
系统为您推荐了相关专利信息
大语言模型
预训练语言模型
问答方法
文本编码器
生成方法
铁路接触网检修
深度图像数据
测距方法
停车场
物体
SPARQL查询
特征提取器
语义
RDF格式数据
有效性