基于大语言模型的交互式机器人抓取方法

正文

推荐专利

基于大语言模型的交互式机器人抓取方法

申请号：CN202510502298

申请日期：2025-04-22

公开号：CN120206528A

公开日期：2025-06-27

类型：发明专利

摘要

本发明提出一种基于大语言模型的交互式机器人抓取方法，该方法包括：根据当前场景的二维图像、对话交互信息和大语言模型，得到任务操作序列，所述任务操作序列包括目标物体、所述目标物体的部件信息、目标抓取位置信息以及动作信息；根据所述二维图像和所述目标抓取位置信息，结合图像分割模型，得到目标掩码区域，并根据所述目标掩码区域和所述当前场景的深度图，得到带有目标抓取位置的三维点云图；根据所述动作信息、带有目标抓取位置的三维点云图和抓取预测模型，得到目标抓取位姿，并根据所述目标抓取位姿，控制机器人对所述目标物体进行抓取。本发明提高了机器人对复杂语义指令的解析能力，还提升了机器人在精细化操作任务中的适应性。

技术关键词

交互式机器人大语言模型抓取方法图像分割模型深度图深度相机计算机存储介质生成二值化图像物体场景序列处理器抓取系统计算机设备存储器语义格式

系统为您推荐了相关专利信息

数据处理方法、装置、计算机设备、存储介质和产品

样本图像标签数据处理方法计算机设备

一种多粒度视觉信息引导的多模态语言生成方法和系统

语言生成方法视觉融合特征大语言模型语言生成系统

基于大语言模型微调算法的专业问答模型的构建方法

问答模型大语言模型专业算法数据

一种问答交互方法、装置、电子设备以及存储介质

文本大语言模型问答交互方法场景节点

一种面向林业垂直领域的语言大模型构造方法

模型构造方法图像编码多模态林业矩阵

基于大语言模型的交互式机器人抓取方法

站点导航

APP 下载