基于深度引导与跨模态特征融合的物体6D位姿预估方法

正文

推荐专利

申请号：CN202510767815

申请日期：2025-06-10

公开号：CN120747214A

公开日期：2025-10-03

类型：发明专利

摘要

本发明公开一种基于深度引导与跨模态特征融合的物体6D位姿预估方法，该方法包括：采集目标物体的RGB图像及Depth图像，将Depth图像转换至相机坐标下的三维点云，对三维点云进行预处理；通过语义分割网络提取RGB图像中的目标区域，同时该目标区域映射至预处理后的三维点云，获得处于目标区域内的目标三维点云；将RGB图像的目标区域及目标三维点云输入6D位姿预估模型，输出目标物体当前在相机坐标系下的6D位姿。在目标物体存在部分遮挡时，通过点特征卷积网络提取目标物体的深度特征，再经深度特征来引导RGB特征权重的调整，有利于改善遮挡导致的目标物体定位精度低的问题。

技术关键词

模态特征纹理特征提取 ResNet网络注意力特征提取单元全局特征提取物体点云语义分割网络图像融合特征坐标系相机 RGB特征模块通道

基于深度引导与跨模态特征融合的物体6D位姿预估方法

站点导航

APP 下载