摘要
本公开提供了基于增强特征投影解耦的单目6D位姿估计方法及系统,涉及机器人视觉感知相关技术领域,包括:获取目标物体场景的单目RGB图像;将单目RGB图像输入到训练后的位姿估计网络中,得到物体的6D位姿;位姿估计网络进行局部特征和多尺度全局特征的提取、融合,得到高维物体增强特征表示;对高维物体增强特征表示进行坐标投影解耦,得到目标物体的三维模型和二维图像间的密集对应映射以及物体掩码;对目标物体的密集对应映射和物体掩码进行位姿回归,得到物体的6D位姿;本发明不需要依赖深度信息、多视角图像以及多种中间表示,仅需使用单目RGB图像即可准确估计物体位姿,降低网络设计和数据标注成本并提高对复杂场景的鲁棒性。
技术关键词
估计方法
物体
非暂态计算机可读存储介质
全局特征融合
全局特征提取
局部特征提取
网络
上采样
三维模型
多阶段
场景
坐标
机器人视觉
电子设备
图像获取模块
处理器
存储器
计算机程序产品
多视角
系统为您推荐了相关专利信息
网页爬取技术
动态数据处理
网页模型
动态数据绑定
图形渲染技术
榆黄菇
实体
生理
作物生长监测技术
成熟度检测装置
三维重建模型
点云图像
深度相机
大语言模型
数据
三维场景模型
三维场景信息
文本生成模型
图像
视角
隧道注浆材料
拓扑结构特征
数据
多尺度
语义特征