一种视觉-语言与探索的具身导航方法和系统

正文

推荐专利

申请号：CN202510475481

申请日期：2025-04-16

公开号：CN119984294B

公开日期：2025-06-20

类型：发明专利

摘要

本发明提供了一种视觉‑语言与探索的具身导航方法及系统，通过获取多通道深度图像视频作为轨迹数据，结合真实环境数据，根据配对样本结构策略及边界点动态选择策略，搜集视觉‑语言与探索大规模轨迹数据集；设置视觉‑语言与探索训练策略，从动态空间记忆库中读取记忆的查询，获得多通道深度图像序列；将在线探索与动态空间记忆库更新结合，连接视觉‑语言定位和探索，构建三维世界移动理解MTU 3D导航，实现终身学习和探索定位；利用大规模轨迹数据集对联合集成优化框架进行训练，将专家数据与嘈杂导航数据相结合，形成视觉‑语言与探索自动轨迹混合模型，在模拟环境和现实场景中进行智能推理及具身导航。

技术关键词

多通道视觉定位轨迹数据记忆轨迹规划器智能推理导航方法分系统动态策略生成轨迹融合语义信息子系统图像导航系统样本框架物体

系统为您推荐了相关专利信息

变电设备数字孪生部件时变一致性自适应保持方法及系统

变电设备数字孪生模型动态特征模型深度强化学习算法卡尔曼滤波算法

信息检测模型生成方法、信息检测方法及计算机设备

检测模型生成方法图像特征提取模型信息检测方法融合特征文本

一种计算机网络入侵检测方法及系统

计算机网络入侵检测网络流量数据集残差神经网络计算机网络流量双向长短期记忆

基于群代数的双目视觉-IMU-RTK融合定位方法

融合定位方法协方差矩阵卡尔曼滤波视觉滑动窗口

一种建筑信息模型构件加载方法

建筑信息模型构件瓦片视觉图像数据处理技术层级

一种视觉-语言与探索的具身导航方法和系统

站点导航

APP 下载