摘要
本发明公开了基于HRformer的抓取位姿检测方法及系统,涉及机械臂抓取位姿检测技术领域;该方法包括如下步骤:获取RGB图像和深度图像,对RGB图像和深度图像分别进行预处理操作;将预处理后的RGB图像和深度图像加权处理进行特征融合,形成多模态输入特征;主干特征提取:基于多模态输入特征,不同尺度均进行全局语义建模及局部特征提取,各尺度之间通过跨分支连接;抓取姿态预测:通过三个分支分别预测抓取点位置、抓取姿态和抓取质量评分,输出对应的热力图,完成最终的抓取姿态检测;设计加权的多任务损失函数。本发明充分利用了HRFormer在全局建模与局部感知上的优势,适应复杂背景和遮挡情况下的抓取任务。
技术关键词
图像
位姿检测方法
多任务学习策略
多任务损失函数
多模态特征融合
损失函数设计
通道注意力机制
局部特征提取
双线性
位姿检测技术
位姿检测系统
多尺度信息
分辨率
物体
网络
分支
回归方法
加权特征
系统为您推荐了相关专利信息
输送控制方法
图像采集终端
位置追踪设备
轮廓面积
坐标系
机器人避障方法
机器人避障装置
语义
车载相机
AGV机器人
费希纳定律
分割方法
三维CT图像
语义
网络模块