基于视觉感知与大语言模型的无人机导航推理方法及系统

AITNT
正文
推荐专利
基于视觉感知与大语言模型的无人机导航推理方法及系统
申请号:CN202511062805
申请日期:2025-07-31
公开号:CN120558243A
公开日期:2025-08-29
类型:发明专利
摘要
本发明公开一种基于视觉感知与大语言模型的无人机导航推理方法及系统,属于无人机导航与人工智能领域,包括通过无人机搭载的摄像头采集目标区域的图像;通过预训练的视觉感知模型对图像进行像素级感知,并将视觉信息转化为结构化数据;采用检索增强生成结合预定义的知识库,将结构化数据转换为大语言模型可处理的关键语句;采用提示工程与思维链技术,由大语言模型根据关键语句与当前任务输出导航指令;当遇到未知类型目标时,启动主动学习流程,通过人为干预实现边缘端知识库的实时更新;本发明有效解决复杂环境下无人机对动态场景的理解与决策问题,为无人机自主飞行提供数据驱动的智能支持,具有实时性强、环境适应性高、决策可靠性好的优势。
技术关键词
推理方法 推理系统 视觉 案例库 记录无人机 语句 三元组 无人机自主飞行 生成场景 指令 语义 图像采集模块 实体 动态场景 数据 像素
系统为您推荐了相关专利信息
1
一种图像去雨雾的方法、装置、设备和介质
去雾图像 自动编码器 注意力 大气散射模型 滤波
2
一种结合提示学习双分支网络模型的赤泥空间提取方法
卫星遥感影像 赤泥 全局特征提取 双分支网络 场景分类
3
智能体驱动的任务处理方法及相关设备
视频 视觉特征 大语言模型 标注工具 指令
4
一种基于视觉-语言模型的极地海冰语义分割方法
极地海冰 图像嵌入 语义分割方法 可见光 视觉
5
基于视觉的落石冲击构筑物风险评估及控制方法、体系
立体视觉传感器 构筑物 三维点云数据 运动轨迹数据 风险
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号