摘要
本发明公开一种基于视觉感知与大语言模型的无人机导航推理方法及系统,属于无人机导航与人工智能领域,包括通过无人机搭载的摄像头采集目标区域的图像;通过预训练的视觉感知模型对图像进行像素级感知,并将视觉信息转化为结构化数据;采用检索增强生成结合预定义的知识库,将结构化数据转换为大语言模型可处理的关键语句;采用提示工程与思维链技术,由大语言模型根据关键语句与当前任务输出导航指令;当遇到未知类型目标时,启动主动学习流程,通过人为干预实现边缘端知识库的实时更新;本发明有效解决复杂环境下无人机对动态场景的理解与决策问题,为无人机自主飞行提供数据驱动的智能支持,具有实时性强、环境适应性高、决策可靠性好的优势。
技术关键词
推理方法
推理系统
视觉
案例库
记录无人机
语句
三元组
无人机自主飞行
生成场景
指令
语义
图像采集模块
实体
动态场景
数据
像素
系统为您推荐了相关专利信息
卫星遥感影像
赤泥
全局特征提取
双分支网络
场景分类
立体视觉传感器
构筑物
三维点云数据
运动轨迹数据
风险