一种多层次跨媒体融合的视觉语言导航方法

正文

推荐专利

一种多层次跨媒体融合的视觉语言导航方法

申请号：CN202410915863

申请日期：2024-07-09

公开号：CN118758310A

公开日期：2024-10-11

类型：发明专利

摘要

本发明公开了一种多层次跨媒体融合的视觉语言导航方法。本发明步骤:1、智能体利用高通量模拟器在3D仿真环境中获取视觉信息，基于视觉信息，利用观测驱动的航路点预测器，将空间可达性和图像文本相似度作为条件，预测一系列的候选航路点；将沿遍历路径的历史观察的候选航路点与当前观察的候选航路点合并，形成并维护更新全局拓扑图；2、构建协同导航规划模块；3、由协同导航规划模块制定相应的导航路径，控制模块将其精确转化为智能体执行的一系列参数化的低级动作，以到达规划的导航目标位置。本发明克服了在传统拓扑地图中表示视觉特征的局限性，为智能体提供了更有效、更准确的导航策略。

技术关键词

导航方法多层次视觉特征节点拓扑图深度全景图 RGB特征控制模块仿真环境导航路径规划像素点跨模态编码记忆图像模拟器

系统为您推荐了相关专利信息

基于可弹性伸缩分布式负载均衡的容器镜像扫描方法及系统

容器组扫描策略镜像仓库负载均衡算法扫描方法

一种改进的图像分割方法、系统、设备及介质

图像分割方法空间金字塔池化图像分割系统图像语义分割技术影像

一种基于人工智能的监控视频分析方法、装置及设备

卷积网络模型监控视频分析方法大语言模型服务端客户端

用于燃料包壳磨损预测的加速方法、系统、设备及介质

磨损形貌三维有限元模型网格周期功率

基于多参数融合的汽轮机通流状态实时监测与诊断系统

混合诊断模型动态决策树参数动态时间窗口节点

一种多层次跨媒体融合的视觉语言导航方法

站点导航

APP 下载