一种基于跨模态重建自监督训练的6D位姿估计方法

正文

推荐专利

申请号：CN202510679418

申请日期：2025-05-23

公开号：CN120510218A

公开日期：2025-08-19

类型：发明专利

摘要

本发明公开一种基于跨模态重建自监督训练的6D位姿估计方法，获取场景图和深度图裁剪得到包含目标物体的目标图和深度图，目标图处理成掩码图后提取图像特征和点云特征，利用跨模态交叉注意力机制训练得到图像点云融合特征，再重建图像并输出位姿估计特征对实现自监督，加载训练后模型权重结合位姿估计特征对通过位姿解码器输出6D估计位姿。本发明方法有效地融合来自不同传感器模态的信息，同时利用精选通道融合策略去除了冗余信息，得到更加精确的6D位姿，对于后续的进一步控制识别提供了精准位置信息。能够从不同角度和维度理解物体的特征，面对遮挡和光照不足等情况时多种传感器信息结合使用，相较单一模态输入具有更好的鲁棒性。

技术关键词

跨模态估计方法交叉注意力机制点云特征深度图融合特征热力图数据生成图像模态特征优化神经网络图像解码器计算机存储介质融合策略处理器通信物体

系统为您推荐了相关专利信息

一种荔枝移振复合采收设备及其采收方法

同步带直线模组推杆升降机构果实收集机构并联机构连续体

一种跨模态时序语义对齐的动作质量评估方法及系统

跨模态动作特征文本嵌入特征序列

基于对比学习与交叉注意力机制的智能分诊方法及系统

分类特征智能分诊方法交叉注意力机制医学影像数据病历

一种基于超图对比学习的SMT焊点检测方法

焊点检测方法节点特征交叉注意力机制知识蒸馏技术融合特征

一种基于单目视觉深度估计的含雾图像生成方法

图像生成方法深度图场景深度估计锐化滤波亮度

一种基于跨模态重建自监督训练的6D位姿估计方法

站点导航

APP 下载