一种基于生成数据驱动学习的视觉语言导航方法及系统

正文

推荐专利

申请号：CN202410897028

申请日期：2024-07-05

公开号：CN118424301B

公开日期：2024-11-19

类型：发明专利

摘要

本发明提出涉及一种基于生成数据驱动学习的视觉语言导航方法及系统，涉及深度学习和计算机视觉的技术领域，方法包括获取轨迹‑指令对，轨迹‑指令对包括原始轨迹和原始指令；对原始轨迹进行视觉观察重写，生成新轨迹视觉观测图像；对原始指令和新轨迹视觉观测图像进行指令重写，分别生成原始对齐序列地标信息和新序列观测描述信息；对原始对齐序列地标信息和新序列观测描述信息进行预处理，生成新轨迹配对指令；将新轨迹配对指令和轨迹‑指令对混合，得到混合数据集，利用混合数据集，对预设的视觉语言导航模型训练，得到训练好的视觉语言导航模型。本发明有效提高了视觉语言导航性能，能够应用于未知场景，降低了未标注数据处理成本。

技术关键词

导航方法轨迹地标指令大语言模型序列数据表达式执行全景文本编码器图像编码器列表计算机视觉导航模块导航系统基准相机

系统为您推荐了相关专利信息

一种步进梁运动人员闯入识别方法、系统、设备及介质

行人位置检测实时图像步进梁行人检测模型识别方法

一种燃煤电站烟气量快速预测方法、系统、介质及设备

燃煤电站烟气燃煤发电机组烟气含氧量理论机器学习模型

数据库表结构变更信息处理方法、装置及电子设备

变更信息处理方法数据库表结构数据依赖关系计算机执行指令代码库

用于汽车自动驾驶紧急避障的轨迹优化方法、装置、终端及存储介质

汽车自动驾驶轨迹优化方法加速度多项式方程

光伏功率数据的处理方法、装置、设备、介质及产品

历史气象数据光伏电站功率计算机执行指令重构算法

一种基于生成数据驱动学习的视觉语言导航方法及系统

站点导航

APP 下载