一种利用视觉语言模型的机器人自主抓取方法与系统

正文

推荐专利

申请号：CN202510196609

申请日期：2025-02-21

公开号：CN120572514A

公开日期：2025-09-02

类型：发明专利

摘要

本发明公开了一种利用视觉语言模型的机器人自主抓取方法与系统，所述方法通过获取用户输入的自然语言抓取指令和目标工作空间的RGB‑D数据；通过视觉语言模型根据RGB‑D数据对自然语言抓取指令进行检测，确定检测结果；当检测结果为正确时，根据自然语言抓取指令和RGB‑D数据确定抓取位姿；基于抓取位姿抓取目标物体。由于多模态大语言模型结合了文本、图像、语音等多种模态，能够理解和生成与视觉相关的语言内容，本发明采用多模态大语言模型理解、检测自然语言抓取指令，得到正确的自然语言抓取指令，从而根据自然语言抓取指令抓取目标物体，解决了现有技术通过简单的语言指令控制机械臂进行抓取，无法灵活处理复杂指令的问题。

技术关键词

机器人自主抓取自然语言视觉点云数据大语言模型物体指令多模态抓取物品抓取模块坐标系处理器可读存储介质方程程序存储器机械臂终端

系统为您推荐了相关专利信息

一种泛癌细胞检测方法、系统及存储介质

癌细胞检测方法感知特征融合特征分类网络细胞分类器

一种基于时空融合的风电功率预测方法及系统

电功率预测方法站点深度神经网络模型异常数据处理数据处理模块

一种航空发动机叶片表面缺陷的激光修复路径规划方法及规划系统

修复路径规划方法航空发动机叶片加工点样条曲线

一种网络拓扑图生成方法、装置、设备及存储介质

节点网络拓扑数据生成方法层级布局算法

一种数据自动分类分级方法及其系统

分类分级方法循环神经网络模型自动化算法数据分类更新模型参数

一种利用视觉语言模型的机器人自主抓取方法与系统

站点导航

APP 下载