摘要
本发明属于三维感知技术领域,公开了一种基于可学习先验扩散模型的类级别物体位姿估计方法。本发明在训练过程中,可学习先验特征的参数能够动态更新,无需采集特定类别三维模型,有效提高了网络对类别信息的学习能力。本方法引入了Transformer扩散模型,并结合位置编码模块,增强了网络对物体三维信息的理解能力,从而提高了物体姿态估计的准确性。针对具有对称性的物体,本发明从物体位姿的概率分布出发,巧妙应对因对称性导致的多个可能姿态解的复杂性问题,有效避免了对称性对姿态估计的干扰,显著提升了网络在此类物体上的估计性能。本发明提供了一种高效、精准的姿态估计方法,为智能机器人抓取提供了可靠的技术支持。
技术关键词
物体位姿估计方法
编码模块
图像
关键点
点云特征
尺寸
三维感知技术
噪声预测
生成噪声
物体姿态估计
物体三维信息
姿态估计方法
解码模块
三维空间结构
参数
网络
注意力
近邻算法
系统为您推荐了相关专利信息
分类识别系统
因子
生态
环境监测数据
分类识别方法
特征提取网络
掌静脉图像
加权特征
图像识别方法
融合特征
遥感图像分割方法
图像分割模型
二维离散小波变换
二维离散小波逆变换
联合损失函数