摘要
本发明提供了一种基于多模态提示的无人机及高低空协同目标搜索方法和系统,通过构建多模态提示词,使得在进行搜索时,在搜索意图与参考图像的作用下进行更精确的搜索,提高了搜索准确率。通过高空无人机先进行大范围搜索得到多个候选感兴趣区域ROI的俯视图和候选目标边界框,然后将多个感兴趣区域的俯视图及目标边界框根据置信度排序后作为子任务依次派给低空无人机进行近距离搜索,从而通过高低空协同快速得到较精准的目标搜索结果。
技术关键词
低空无人机
多模态
高空无人机
搜索意图
检测网络模型
搜索方法
图像生成模型
图像编码器
文本编码器
感兴趣区域边界
实体
注意力机制
词典
视角
分词
系统为您推荐了相关专利信息
跨模态
多粒度特征
大语言模型
生成对抗网络
视觉特征
推荐展示方法
三维可视化引擎
多源异构数据
多模态特征融合
展示界面