基于HRformer的抓取位姿检测方法及系统

AITNT
正文
推荐专利
基于HRformer的抓取位姿检测方法及系统
申请号:CN202510948466
申请日期:2025-07-10
公开号:CN120953363A
公开日期:2025-11-14
类型:发明专利
摘要
本发明公开了基于HRformer的抓取位姿检测方法及系统,涉及机械臂抓取位姿检测技术领域;该方法包括如下步骤:获取RGB图像和深度图像,对RGB图像和深度图像分别进行预处理操作;将预处理后的RGB图像和深度图像加权处理进行特征融合,形成多模态输入特征;主干特征提取:基于多模态输入特征,不同尺度均进行全局语义建模及局部特征提取,各尺度之间通过跨分支连接;抓取姿态预测:通过三个分支分别预测抓取点位置、抓取姿态和抓取质量评分,输出对应的热力图,完成最终的抓取姿态检测;设计加权的多任务损失函数。本发明充分利用了HRFormer在全局建模与局部感知上的优势,适应复杂背景和遮挡情况下的抓取任务。
技术关键词
图像 位姿检测方法 多任务学习策略 多任务损失函数 多模态特征融合 损失函数设计 通道注意力机制 局部特征提取 双线性 位姿检测技术 位姿检测系统 多尺度信息 分辨率 物体 网络 分支 回归方法 加权特征
系统为您推荐了相关专利信息
1
一种基于多模态图像融合的电芯外观检测方法及装置
图像 外观检测方法 多模态 像素 构建训练集
2
基于机器视觉的智能分拣输送控制方法
输送控制方法 图像采集终端 位置追踪设备 轮廓面积 坐标系
3
基于语义信息的AGV机器人避障方法及装置
机器人避障方法 机器人避障装置 语义 车载相机 AGV机器人
4
一种基于深度学习的燃料厂侧智能监管系统
智能监管系统 关键点 燃料 数据 深度学习模型
5
一种结合韦伯费希纳定律与语义扩散的肺实质分割方法
费希纳定律 分割方法 三维CT图像 语义 网络模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号