摘要
本发明属于机械臂抓取技术领域,公开一种基于视觉‑力觉的机械臂指令抓取方法,包括以下步骤:获取场景的RGB‑D图像,通过OpenCV对RGB‑D图像进行切割处理,并提取RGB‑D图像中每个物体的视觉特征;通过BERT对用户输入的文本命令进行编码,并输出语言特征;将语言特征和视觉特征输入CLIP模型中融合对齐,再采用Co‑TRM结构进行进一步对齐,生成双模态特征;根据RGB‑D图像的深度图生成点云图像,基于点云图像,结合物体的视觉特征,通过Graspnet生成抓取姿态;解决了现有技术中基于视觉和指令进行抓取时存在着不便于对抓取力进行自适应调整的问题。
技术关键词
视觉特征
抓取方法
物体
双模态
点云图像
SAC算法
机械臂抓取技术
网络
多模态特征
策略
指令
交叉注意力机制
文本
深度图
命令
系统为您推荐了相关专利信息
车辆图像数据
检测停车位
标记
车牌识别技术
背景减除算法
计数监控方法
气体吹扫系统
监控平台
激光散射原理
气体采样系统
点云图像
变化监测方法
运动结构
贴片
变化监测装置
视觉特征
大数据管理方法
可视化交互界面
分支
模块