摘要
本发明公开了一种基于时空隐式锚点查询的端到端类别级物体位姿估计方法,包括以下步骤:将RGB图像序列输入视觉编码器,提取多尺度语义特征并融合深度和法向量几何特征,生成2.5维多尺度特征。基于此特征建立3D隐式锚点队列,通过置信度筛选和相机位姿偏移量变换处理队列中的查询。利用多头注意力对时空关联进行建模,输出时序增强的查询特征,并进行几何感知特征采样。最后,通过二分图匹配将隐式3D查询映射为9自由度姿态参数,实现端到端训练。
技术关键词
物体位姿估计方法
查询特征
位姿估计系统
队列
多尺度语义特征
子模块
感知特征
融合语义
多模态特征
注意力
时序
语义特征提取
跨模态
层级
匈牙利算法
特征金字塔
双线性插值
参数
系统为您推荐了相关专利信息
管理方法
构建数据仓库
物流业务系统
分布式消息队列
登录界面
原始观测数据
队列模型
空闲停车位
神经网络模型
序列
回收机器人
机器人控制系统
回收管理系统
垃圾回收系统
后台服务器