摘要
本发明公开了一种基于多尺度可变形注意力的6D物体位姿估计方法、系统、终端及存储介质,所述方法包括:获取目标RGB图像,并特征提取处理,得到多个特征图像;对多个特征图像进行语义标注处理和平移估计处理,得到多个语义标签的掩码和多个隐含中心点位置的向量,并根据多个语义标签的掩码和多个隐含中心点位置的向量得到3D平移向量;对多个特征图像进行旋转回归处理,得到3D旋转估计值,并根据3D旋转估计值和3D平移向量得到6D位姿估计结果。本发明通过计算目标RGB图像的3D平移向量和3D旋转估计值,并通过3D平移向量和3D旋转估计值得到6D位姿估计结果,能够有效提高目标RGB图像物体位姿估计的准确性和稳定性。
技术关键词
物体位姿估计方法
物体姿态估计
语义标签
注意力
多尺度
特征描述符
图像
降维特征
位姿估计系统
上采样
特征金字塔
可读存储介质
处理器
终端
采样模块
程序
存储器
系统为您推荐了相关专利信息
染色
定量分析方法
切片
多任务损失函数
反卷积算法
肌电信号识别
频域特征
分类方法
校准
多元线性回归算法
车内酒精浓度
交互特征
面部语义特征
多通道特征融合
面部特征
评价算法
特征金字塔网络
点云
特征提取单元
图像块