一种基于视觉语义和地图集成的零样本连续视觉语言导航方法

AITNT
正文
推荐专利
一种基于视觉语义和地图集成的零样本连续视觉语言导航方法
申请号:CN202510499754
申请日期:2025-04-21
公开号:CN120403600B
公开日期:2025-11-25
类型:发明专利
摘要
本发明公开一种基于视觉语义和地图集成的零样本连续视觉语言导航方法,包括以下步骤:S1.接受当前导航任务的自然语言指令,并通过文本编码器对其进行编码和特征提取,以获得指令特征;S2.捕获执行任务时的RGB视图,对RGB视图中的环境知识进行解耦,获得环境解耦知识;S3.捕获执行任务时的Depth视图,结合RGB视图以及指令特征,通过跨模态注意力网络获得自我中心的语义地图;S4.结合语义地图以及指令特征,根据航点生成网络生成一系列通向目标的可导航航点;S5.利用这些可导航航点以及环境解耦知识,预测导航智能体当前的导航动作;S6.重复上述步骤,直至导航任务完成或达到最大移动步数。
技术关键词
语义地图 导航方法 网格地图 视觉 规划决策模块 物体 文本编码器 指令 样本 BERT模型 自然语言 跨模态 矩阵 注意力机制 网络 精确地识别
系统为您推荐了相关专利信息
1
医疗机器人移动平台定位方法、融合地图构建方法
SLAM地图 移动平台定位方法 地图构建方法 扩展卡尔曼滤波算法 医疗机器人
2
一种基于忆阻阵列蚁群算法的图像边缘检测方法
图像边缘检测方法 蚁群算法 蚂蚁 像素点 忆阻器模型
3
一种基于AIGC课堂行为反馈教学系统
教学系统 视频采集单元 三维虚拟形象 深度学习训练 识别模块
4
一种基于大模型能力的通用安全风险监测方法和系统
风险监测方法 图像场景识别 场景类别 图像识别模型 标签文本
5
一种输电线锤式破冰器
破冰器 驱动轮 除冰系统 破冰机器人 线槽
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号