一种语言驱动的物体抓取姿态预测方法、终端及存储介质

正文

推荐专利

申请号：CN202510162677

申请日期：2025-02-14

公开号：CN119625072B

公开日期：2025-07-01

类型：发明专利

摘要

本发明公开了一种语言驱动的物体抓取姿态预测方法、终端及存储介质，涉及人工智能与计算机视觉技术领域。本发明提供的语言驱动的物体抓取姿态预测模型是一种引入了语言交互能力的模型，可以结合用户输入的语言提示词进行交互式预测，使得操作者可以通过语言提示词指定抓取对象，并由模型预测出更准确的抓取姿态。本发明拓展了物体抓取姿态预测模型的可交互性和模型灵活性，对非结构化任务场景具有较强泛化性。

技术关键词

姿态预测方法掩膜图像编码器图像嵌入注意力编码器抓取物体标签像素令牌坐标模型误差交互式预测索引卷积模块解码器计算机视觉技术分割器

一种语言驱动的物体抓取姿态预测方法、终端及存储介质

站点导航

APP 下载