基于大语言模型的交互式机器人抓取方法

AITNT
正文
推荐专利
基于大语言模型的交互式机器人抓取方法
申请号:CN202510502298
申请日期:2025-04-22
公开号:CN120206528A
公开日期:2025-06-27
类型:发明专利
摘要
本发明提出一种基于大语言模型的交互式机器人抓取方法,该方法包括:根据当前场景的二维图像、对话交互信息和大语言模型,得到任务操作序列,所述任务操作序列包括目标物体、所述目标物体的部件信息、目标抓取位置信息以及动作信息;根据所述二维图像和所述目标抓取位置信息,结合图像分割模型,得到目标掩码区域,并根据所述目标掩码区域和所述当前场景的深度图,得到带有目标抓取位置的三维点云图;根据所述动作信息、带有目标抓取位置的三维点云图和抓取预测模型,得到目标抓取位姿,并根据所述目标抓取位姿,控制机器人对所述目标物体进行抓取。本发明提高了机器人对复杂语义指令的解析能力,还提升了机器人在精细化操作任务中的适应性。
技术关键词
交互式机器人 大语言模型 抓取方法 图像分割模型 深度图 深度相机 计算机存储介质 生成二值化图像 物体 场景 序列 处理器 抓取系统 计算机设备 存储器 语义 格式
系统为您推荐了相关专利信息
1
数据处理方法、装置、计算机设备、存储介质和产品
样本 图像 标签 数据处理方法 计算机设备
2
一种多粒度视觉信息引导的多模态语言生成方法和系统
语言生成方法 视觉 融合特征 大语言模型 语言生成系统
3
基于大语言模型微调算法的专业问答模型的构建方法
问答模型 大语言模型 专业 算法 数据
4
一种问答交互方法、装置、电子设备以及存储介质
文本 大语言模型 问答交互方法 场景 节点
5
一种面向林业垂直领域的语言大模型构造方法
模型构造方法 图像编码 多模态 林业 矩阵
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号