一种单目3D目标检测方法和装置

AITNT
正文
推荐专利
一种单目3D目标检测方法和装置
申请号:CN202511167795
申请日期:2025-08-20
公开号:CN120953707A
公开日期:2025-11-14
类型:发明专利
摘要
本发明公开了一种单目3D目标检测方法和装置,涉及目标检测技术领域,包括:通过骨干网络对待测单目图像特征提取确定多尺度层级特征;采用特征处理模块对多尺度层级特征分别沿多方向捕捉特征生成多尺度深化特征;基于多尺度深化特征确定深度输入特征和视觉输入特征,对应输入深度编码器和视觉编码器进行编码处理输出深度编码特征和视觉全局特征;根据深度输入特征进行前景深度预测和像素深度估计确定深度位置编码,并与深度编码特征相加生成深度全局特征;通过解码器基于视觉全局特征和深度全局特征进行视觉引导的解码后,输入预测头部进行属性检测输出目标检测结果。基于上述方案,改善在复杂场景下特征提取的局限性,助力提升检测可靠性。
技术关键词
深度编码器 生成多尺度 视觉 分支 层级 解码器 并行特征提取 空间金字塔池化 注意力 图像特征提取 模型训练模块 处理器 网络 特征提取模块 计算机程序产品
系统为您推荐了相关专利信息
1
一种基于5G和区域感知的数字农田图片分类识别装置及方法
图片分类识别 农田 折叠支撑架 分类识别方法 5G信号接收器
2
面向增强维修的现场操作解析方法、装置、设备、介质及产品
解析方法 视觉 微调方法 设备状态数据 多模态
3
一种微流控发泡冲液电弧加工装置及其加工方法
发泡装置 气泡 分配盘 微流控芯片 电解液
4
导光板覆膜方法、装置和设备
视觉引导系统 覆膜方法 机器人抓取 视觉检测系统 表面图像数据
5
一种基于SAM的文本引导多视角火星地形特征图像分割方法
图像分割方法 地形特征 分支 多视角 文本编码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号