基于关键点指导的机器人视觉语言导航方法、装置及设备

AITNT
正文
推荐专利
基于关键点指导的机器人视觉语言导航方法、装置及设备
申请号:CN202510219635
申请日期:2025-02-26
公开号:CN120388191A
公开日期:2025-07-29
类型:发明专利
摘要
本发明提供一种基于关键点指导的机器人视觉语言导航方法、装置及设备,方法包括:提取语音指令的关键字作为目标文本;基于多模态预训练知识库,确定目标文本对应的知识原型特征,从知识原型特征,以及RGB图像对应的多个区域特征之间的相似度中确定出相似度最大的目标相似度;在目标相似度大于预设阈值的情况下,确定目标相似度对应的匹配对中区域特征中的目标物体,基于目标物体的深度信息,确定目标物体的目标坐标,基于目标坐标和机器人移动模型,确定机器人的导航路径。该方法通过视觉‑语言跨模态匹配,计算目标文本与图像区域的相似度以实现导航监督;能够在复杂场景中实现多模态信息的高效融合,显著提升机器人导航的精度和鲁棒性。
技术关键词
机器人视觉 导航方法 关键点 原型 物体 文本 速度 非暂态计算机可读存储介质 坐标系 图像 转向轮 关键字 多模态信息 底盘 相机 处理器 导航装置
系统为您推荐了相关专利信息
1
一种多模态数字人生成方法和系统
关键点 生成数字人 生成系统 面部 多模态
2
一种面向人机协作场景的以人为中心的视觉感知方法
面向人机协作 视觉感知方法 恢复算法 多分辨率特征 动作识别模型
3
一种基于分层脉冲强化学习的无人机避障导航方法
无人机避障 导航方法 决策 强化学习模型 脉冲
4
一种基于三维网格计算人脸模型容积差的方法
纹理 人脸关键点检测 三维人脸模型 容积 顶点
5
基于深度学习的血管介入手术导航方法、装置及系统
血管减影图像 血管分割 血管介入手术 导航方法 深度学习模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号