基于视觉语言模型的机器人任务执行方法以及装置

正文

推荐专利

申请号：CN202410960271

申请日期：2024-07-17

公开号：CN119005461A

公开日期：2024-11-22

类型：发明专利

摘要

本发明提供一种基于视觉语言模型的机器人任务执行方法以及装置，涉及人工智能领域。其中，基于视觉语言模型的机器人任务执行方法包括：获取第一目标区域附近的点云数据信息以及所述目标物体的点云数据信息；根据第一目标区域附近的点云数据信息以及所述目标物体的点云数据信息，在目标物体周围确定多个候选区域；将多个候选区域，投影到机器人到达第一目标区域后，面对目标物体时拍摄的图像上，得到携带多个候选区域的信息的第一图像数据；利用视觉语言模型，根据第一图像数据和目标任务的信息，从多个候选区域中确定第二目标区域。本发明可以在机器人接收到针对目标物体执行的目标任务后，将机器人引导到目标物体附近的适合执行目标任务的区域。

技术关键词

栅格地图物体导航算法视觉数据图像引导机器人非暂态计算机可读存储介质坐标导航模块处理器点云计算机程序产品执行装置网格存储器终端

系统为您推荐了相关专利信息

一种基于大语言模型的区块链智能合约漏洞分析系统

漏洞大语言模型区块链智能合约分析系统信息安全保护技术

基于多模态感知的运动估计方法、装置及电子设备

柔性形变传感器 IMU传感器柔性压力传感器对象运动估计方法

一种架空输电线路覆冰厚度预测方法、系统、设备、介质及产品

架空输电线路传感器覆冰机器学习模型电力系统智能

一种数字化全口义齿的制作方法

人工牙全口义齿三维模型成品两次扫描

一种基于雷达点云数据和NDT算法的道闸杆状态监测方法

雷达点云数据状态监测方法道闸杆网格模型算法

基于视觉语言模型的机器人任务执行方法以及装置

站点导航

APP 下载