一种基于多模态大模型的抓取姿态生成方法及系统

正文

推荐专利

申请号：CN202511003395

申请日期：2025-07-21

公开号：CN120588235A

公开日期：2025-09-05

类型：发明专利

摘要

本发明公开了一种基于多模态大模型的抓取姿态生成方法及系统，当输入语音指令和RGB图像时，将视觉特征与语义特征在多模态大模型中跨模态匹配得到控制函数代码与目标物体的位置信息；当输入带有手绘指令的RGB图像时，得到控制函数代码、目标物体与路径点的位置信息；根据目标物体的位置信息再结合深度信息计算出目标物体的点云数据，预处理后，将目标物体的理想点云输入目标识别网络模型，对目标物体区域的点云进行抓取区域识别，输出高抓取置信度区域，并映射真实坐标系；构建点云包围盒，生成抓取姿态候选集合；通过计算抓取姿态候选分数，选出质量最高的抓取姿态，作为机器人抓取位姿；结合控制函数代码及抓取路径执行目标抓取任务。

技术关键词

语义特征生成方法多模态物体视觉特征点云机器人抓取关键点多尺度特征提取网络模型训练局部特征提取指令坐标系自然语言图像数据处理模块全局结构信息关键字

系统为您推荐了相关专利信息

基于具身机器人的车辆自动化测试方法和系统

机器人自动化测试方法车载传感器车辆多模态特征

衣物护理平整度监测方法、电子设备及织物清洁设备

护理衣物衣物护理纹理特征监测方法激光投影模块

基于用户行为分析的智能广告优化投放系统

投放系统多层感知机排序模型广告特征文本

障碍物检测方法、装置、存储介质及电子装置

障碍物检测方法语义特征融合特征数据激光雷达

一种机器人地图的自动更新方法、装置、电子设备及存储介质

全局地图自动更新方法机器人地图动态更新机器可读指令

一种基于多模态大模型的抓取姿态生成方法及系统

站点导航

APP 下载