一种连续环境的视觉语言导航方法及系统

AITNT
正文
推荐专利
一种连续环境的视觉语言导航方法及系统
申请号:CN202511259801
申请日期:2025-09-04
公开号:CN120947643A
公开日期:2025-11-14
类型:发明专利
摘要
本发明提供了一种连续环境的视觉语言导航方法及系统,涉及视觉语言导航领域,基于语言指令和初始化为空的环境拓扑图,智能体采用分步导航的方式在未知的连续环境中自主导航到指定位置,每个分步导航的具体操作包括:获取智能体当前位置的局部全景图像和当前环境拓扑图;基于元认知监控,进行死锁检测,未检测到死锁则识别局部全景图像中的候选航路点,生成候选航路点的节点特征,并添加到当前环境拓扑图中,从当前环境拓扑图中选择最佳航路点;通过基于深度图的主动推理避障方法,生成智能体当前位置的底层动作指令;本发明将元认知监控、门控多模态融合决策以及推理–反应主动避障有机结合,为连续环境下的视觉语言导航提供了系统化的解决方案。
技术关键词
导航方法 拓扑图 节点特征 非暂态计算机可读存储介质 避障方法 深度图 姿态特征 生成智能 视觉特征 图像 语义 指令 注意力机制 融合特征 电子设备 深度学习模型 存储器
系统为您推荐了相关专利信息
1
一种基于大语言模型的反馈信息处理方法及其装置
反馈信息处理方法 大语言模型 标签体系 文本 语音
2
应用程序的安全风险检测方法、装置、设备、介质和产品
应用程序安装包 风险检测方法 任务调度 网络地址解析 图标
3
人脸模型训练方法、人脸重建方法、装置、设备及介质
人脸模型训练方法 关键点 人脸形状 人脸表情 参数
4
知识问答方法、装置、电子设备及存储介质
知识问答方法 视频 知识问答技术 非暂态计算机可读存储介质 知识问答系统
5
叶菜类幼苗识别和移栽夹持位置检测方法及装置
夹持位置检测方法 样本 表型特征 标签 可变形卷积网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号