基于关键点指导的机器人视觉语言导航方法、装置及设备

正文

推荐专利

申请号：CN202510219635

申请日期：2025-02-26

公开号：CN120388191A

公开日期：2025-07-29

类型：发明专利

摘要

本发明提供一种基于关键点指导的机器人视觉语言导航方法、装置及设备，方法包括：提取语音指令的关键字作为目标文本；基于多模态预训练知识库，确定目标文本对应的知识原型特征，从知识原型特征，以及RGB图像对应的多个区域特征之间的相似度中确定出相似度最大的目标相似度；在目标相似度大于预设阈值的情况下，确定目标相似度对应的匹配对中区域特征中的目标物体，基于目标物体的深度信息，确定目标物体的目标坐标，基于目标坐标和机器人移动模型，确定机器人的导航路径。该方法通过视觉‑语言跨模态匹配，计算目标文本与图像区域的相似度以实现导航监督；能够在复杂场景中实现多模态信息的高效融合，显著提升机器人导航的精度和鲁棒性。

技术关键词

机器人视觉导航方法关键点原型物体文本速度非暂态计算机可读存储介质坐标系图像转向轮关键字多模态信息底盘相机处理器导航装置

系统为您推荐了相关专利信息

一种多模态数字人生成方法和系统

关键点生成数字人生成系统面部多模态

一种面向人机协作场景的以人为中心的视觉感知方法

面向人机协作视觉感知方法恢复算法多分辨率特征动作识别模型

一种基于分层脉冲强化学习的无人机避障导航方法

无人机避障导航方法决策强化学习模型脉冲

一种基于三维网格计算人脸模型容积差的方法

纹理人脸关键点检测三维人脸模型容积顶点

基于深度学习的血管介入手术导航方法、装置及系统

血管减影图像血管分割血管介入手术导航方法深度学习模型

基于关键点指导的机器人视觉语言导航方法、装置及设备

站点导航

APP 下载