一种基于大语言模型和深度学习的多模式软体手抓取方法及系统

正文

推荐专利

申请号：CN202411111718

申请日期：2024-08-14

公开号：CN118811189A

公开日期：2024-10-22

类型：发明专利

摘要

本发明公开了一种基于大语言模型和深度学习的多模式软体手抓取方法及系统，方法包括：S1，利用深度相机拍摄RGB图片与深度图片；S2，将RGB图片作为输入，使用Yolo模型识别并分割图片中的物体，输出物体名称与其在图中的二维坐标；S3，将S2的输出与指令作为输入，使用GPT4判断应当抓取的物体名称，输出对应的二维坐标；S4，利用获得的二维坐标分割RGB图像与深度图像，获得待抓取对象的分割图；S5，提取RGB图像中物体二维形状特征与深度图像中深度特征，通过SVM分类模型判断物体形状；S6，将判断出的形状与抓取方式建立对应关系，最终得到抓取方式。本发明能够实现高准确率的实时物体识别和操作决策。

技术关键词

抓取物体大语言模型抓取方法 SVM分类图像抓取系统预训练语言模型摄像机深度相机坐标系识别模块深度学习模型模式抓取模块决策形态图片

系统为您推荐了相关专利信息

一种凿岩台车车体定位及位姿补偿方法

凿岩台车补偿方法激光标靶深度相机车体

基于港机设备状态的物联网分布式监控数据同步方法

信息采集终端港机设备分布式监控数据同步方法标记置信度

基于多图拼接和融合的高分辨率大视场成像系统

病理切片图像高分辨率大视场语义特征特征选择编码

一种基于DTW的HPLC谱图聚类的方法及系统

DTW算法色谱层次聚类方法矩阵图像处理

一种基于多式联运的物流货物装箱管理方法及系统

RFID标签物品尺寸信息管理方法运载车三维模型

一种基于大语言模型和深度学习的多模式软体手抓取方法及系统

站点导航

APP 下载