基于视觉感知与大语言模型的无人机导航推理方法及系统

正文

推荐专利

申请号：CN202511062805

申请日期：2025-07-31

公开号：CN120558243A

公开日期：2025-08-29

类型：发明专利

摘要

本发明公开一种基于视觉感知与大语言模型的无人机导航推理方法及系统，属于无人机导航与人工智能领域，包括通过无人机搭载的摄像头采集目标区域的图像；通过预训练的视觉感知模型对图像进行像素级感知，并将视觉信息转化为结构化数据；采用检索增强生成结合预定义的知识库，将结构化数据转换为大语言模型可处理的关键语句；采用提示工程与思维链技术，由大语言模型根据关键语句与当前任务输出导航指令；当遇到未知类型目标时，启动主动学习流程，通过人为干预实现边缘端知识库的实时更新；本发明有效解决复杂环境下无人机对动态场景的理解与决策问题，为无人机自主飞行提供数据驱动的智能支持，具有实时性强、环境适应性高、决策可靠性好的优势。

技术关键词

推理方法推理系统视觉案例库记录无人机语句三元组无人机自主飞行生成场景指令语义图像采集模块实体动态场景数据像素

系统为您推荐了相关专利信息

一种图像去雨雾的方法、装置、设备和介质

去雾图像自动编码器注意力大气散射模型滤波

一种结合提示学习双分支网络模型的赤泥空间提取方法

卫星遥感影像赤泥全局特征提取双分支网络场景分类

智能体驱动的任务处理方法及相关设备

视频视觉特征大语言模型标注工具指令

一种基于视觉-语言模型的极地海冰语义分割方法

极地海冰图像嵌入语义分割方法可见光视觉

基于视觉的落石冲击构筑物风险评估及控制方法、体系

立体视觉传感器构筑物三维点云数据运动轨迹数据风险

基于视觉感知与大语言模型的无人机导航推理方法及系统

站点导航

APP 下载