摘要
本发明涉及人工智能技术领域,可应用于医疗健康领域,公开了一种未探索环境下的导航方法、装置、设备及介质,该方法包括:接收用户输入的自然语言导航指令,通过预训练的大语言模型解析为至少包括目标实体信息、空间约束信息和语境意图信息的结构化语义表示;将其输入预训练的大语言模型生成标准化任务描述问句,与实时环境图像数据输入预训练的视觉语言问答模型,输出目标实体是否存在的语义回答结果;若存在,基于结构化语义表示通过预训练的大语言模型生成导航策略,通过预设路径规划算法控制机器人执行导航动作。本发明无需依赖环境地图和场景训练,利用大语言模型和视觉语言问答模型的协同,实现了未探索环境下的导航,解决了传统方案对先验数据的强依赖性问题,具备良好的泛化能力和环境适应性。
技术关键词
环境图像数据
问答模型
语义
实体
指令
视觉
意图
路径规划算法
导航方法
识别自然语言
多帧图像数据
策略
可读存储介质
大语言模型
人工智能技术
医疗健康
处理器
导航装置
对象
系统为您推荐了相关专利信息
检测分析系统
胚胎
数据存储
SIMD指令集
分层存储架构