一种基于历史反思的可变环境视觉语言导航方法和系统

正文

推荐专利

申请号：CN202510309117

申请日期：2025-03-17

公开号：CN119826835B

公开日期：2025-07-25

类型：发明专利

摘要

本发明提供一种基于历史反思的可变环境视觉语言导航方法和系统，涉及计算机视觉、自然语言处理及机器人导航技术领域，该方法为利用大模型视觉编码器与查询变压器，对可变环境视觉观察数据进行处理，得到场景图编码嵌入、下一个动作中所使用的导航历史信息和对应编码嵌入指令；利用门控网络和反思网络，对场景图编码嵌入、下一个动作中所使用的导航历史信息和对应编码嵌入指令进行分析，得到修正指令；反思网络是用于生成修正指令的大语言模型；基于修正指令，利用图感知自注意力机制进行计算，对智能体进行路径导航，得到视觉语言导航结果，完成可变环境的视觉语言导航。本发明解决了视觉语言导航适应性差和容错能力低的问题。

技术关键词

导航方法视觉大语言模型交叉注意力机制编码指令跨模态前馈神经网络拓扑图场景节点机器人导航技术表达式变压器超参数矩阵标签

系统为您推荐了相关专利信息

一种基于多模态具身大模型的超声系统、方法与产品

机械臂旋转特征视觉特征提取超声系统多模态

语句联想方法、装置、设备及产品

语句联想方法大语言模型终端生成提示词

一种基于多解分离的容错式多源融合导航定位方法

导航定位方法故障容错监测故障故障树模型模式

基于工艺优化的同步双向拉伸薄膜生产控制方法及系统

状态空间预测拉伸薄膜序列纵向拉伸薄膜生产线

基于视觉SLAM的NeRF地图构建方法及装置

实例分割地图构建方法关键帧地图模型特征点

一种基于历史反思的可变环境视觉语言导航方法和系统

站点导航

APP 下载