一种使用大型语言模型的机器臂抓握姿态决策的方法

正文

推荐专利

申请号：CN202410800972

申请日期：2024-06-20

公开号：CN118386250A

公开日期：2024-07-26

类型：发明专利

摘要

本发明公开了一种使用大型语言模型的机器臂抓握姿态决策的方法，包括以下步骤：通过场景语义分割模块对真实世界的照片进行分割，得到场景中潜在的物品实例位置的掩码，将掩码与原本的照片进行相交计算,得到照片中物品的实例图像并输入物体识别模块，得到实例图像中物品实例的可能的种类名称以及该物品是该种类的种类概率，将可能的种类名称、种类概率和用户需求一同输入到大型语言模型决策模块，得到决策的物品种类，将决策的物品种类对应掩码的坐标，输入到抓握姿态生成模块中，根据输入的掩码的坐标对所有抓握姿态的像素坐标进行筛选，按照距离最近选择，得到距离输入的掩码的坐标最近的抓握姿态，提升了系统的灵活性和适应性。

技术关键词

决策机器臂场景语义分割照片识别模块图像抓取网络像素物体文本坐标系基础矩阵相机图片

一种使用大型语言模型的机器臂抓握姿态决策的方法

站点导航

APP 下载