一种连续环境的视觉语言导航方法及系统

正文

推荐专利

一种连续环境的视觉语言导航方法及系统

申请号：CN202511259801

申请日期：2025-09-04

公开号：CN120947643A

公开日期：2025-11-14

类型：发明专利

摘要

本发明提供了一种连续环境的视觉语言导航方法及系统，涉及视觉语言导航领域，基于语言指令和初始化为空的环境拓扑图，智能体采用分步导航的方式在未知的连续环境中自主导航到指定位置，每个分步导航的具体操作包括：获取智能体当前位置的局部全景图像和当前环境拓扑图；基于元认知监控，进行死锁检测，未检测到死锁则识别局部全景图像中的候选航路点，生成候选航路点的节点特征，并添加到当前环境拓扑图中，从当前环境拓扑图中选择最佳航路点；通过基于深度图的主动推理避障方法，生成智能体当前位置的底层动作指令；本发明将元认知监控、门控多模态融合决策以及推理–反应主动避障有机结合，为连续环境下的视觉语言导航提供了系统化的解决方案。

技术关键词

导航方法拓扑图节点特征非暂态计算机可读存储介质避障方法深度图姿态特征生成智能视觉特征图像语义指令注意力机制融合特征电子设备深度学习模型存储器

系统为您推荐了相关专利信息

一种基于大语言模型的反馈信息处理方法及其装置

反馈信息处理方法大语言模型标签体系文本语音

应用程序的安全风险检测方法、装置、设备、介质和产品

应用程序安装包风险检测方法任务调度网络地址解析图标

人脸模型训练方法、人脸重建方法、装置、设备及介质

人脸模型训练方法关键点人脸形状人脸表情参数

知识问答方法、装置、电子设备及存储介质

知识问答方法视频知识问答技术非暂态计算机可读存储介质知识问答系统

叶菜类幼苗识别和移栽夹持位置检测方法及装置

夹持位置检测方法样本表型特征标签可变形卷积网络

一种连续环境的视觉语言导航方法及系统

站点导航

APP 下载