摘要
本发明涉及一种指令类型无关视觉语言导航方法,所述方法包括:步骤1,对多种类型指令进行混合,形成混合指令文本并对I进行文本编码,通过指令判别器进行分类得到分类概率pω,作为专家网络中专家路由依据;步骤2,构造跨模态硬分支路由专家网络Cross_MoE;步骤3,基于LLM的指令规范,对混合指令文本I使用大语言模型LLM进行指令规范得到指令要素集合I‘,等步骤。本发明所述方法的优越技术效果是,能够有效提升了系统对多类指令的处理能力,解决了传统导航模型在处理多类型指令在面对复杂的、多样化的指令时性能下降的不足;避免了复杂的操作步骤,使人机交互更加自然流畅,尤其对于非技术用户系统的使用门槛大大降低。
技术关键词
指令
导航方法
编码特征
混合专家网络
大语言模型
文本
输出特征
视觉
跨模态
分支
地标
拓扑地图
分类特征
模态特征
注意力
模板
编码器
节点
系统为您推荐了相关专利信息
编程方法
电极
三维模型
计算机程序产品
可读存储介质