一种基于双目视觉和开放词汇的3D目标检测方法及系统

AITNT
正文
推荐专利
一种基于双目视觉和开放词汇的3D目标检测方法及系统
申请号:CN202411739388
申请日期:2024-11-29
公开号:CN119672305A
公开日期:2025-03-21
类型:发明专利
摘要
本发明公开了一种基于双目视觉和开放词汇的3D目标检测方法及系统,涉及目标检测技术领域。该方法包括:采用开放词汇2D检测模型计算每幅图像的像素特征;将左右视图的像素特征聚合到每个三维点上;基于左右视图的像素特征获取视差估计图;引入时间聚合引导视差一致性约束,以得到深度视差估计图;将深度视差估计图转换为3D点云,提取特征,得到3D特征;利用对象级图像引导检测损失、对象级交叉对比对齐和对象级自我对比学习将文本特征与2D融合特征向量、3D特征进行关联集成,以得到三维目标检测模型,实现三维目标检测,对不同目标对象进行区分。本发明可实现目标的精准检测与区分,从而提高3D目标识别的灵活性和通用性。
技术关键词
检测损失 对象 特征提取模块 像素 视觉 学生 图像 样本 3D点云 教师 文本 深度图 预训练模型 盒子 处理器 检测盒 跨模态 可读存储介质 检测头
系统为您推荐了相关专利信息
1
基于自适应参数调节的图像矢量化方法和装置
光栅图像 控制点 图像矢量化方法 采样点 超像素分割算法
2
一种静态三维光场内容生成方法及系统
内容生成方法 图像 参数 矩阵 序列
3
基于小波散射网络的电缆破损检测方法及系统
破损检测方法 检测电缆 多尺度特征 LSTM模型 小波散射网络
4
基于X光图像的航空发动机零部件缺陷检测方法
航空发动机零部件 缺陷检测方法 延续性 像素点 零部件缺陷检测
5
一种多媒体图像优化方法及系统
图像优化方法 HSI颜色空间 拉普拉斯金字塔 高斯金字塔 多媒体
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号