摘要
本发明公开了一种基于多模态视觉的无人机对地目标追踪方法及系统,首先利用多模态传感器在无人机上采集目标多模态图像并获得采集图像数据,再对采集图像数据进行图像预处理并获得预处理后图像数据,接着构建基于Transformer架构并集成模态交互机制的深度学习模型;本发明实现了具有采用无人机搭载RGB和红外相机的方式获取目标的多模态图像数据从而应对复杂场景中的低光照和遮挡的功能,且采用基于Transformer架构的深度学习模型能提取双模态特征,而通过多头自注意力机制进行特征融合能增强目标识别能力,同时图像追踪模型在部署到无人机上后能实现每秒超过30帧的实时追踪并自动生成目标追踪报告,提高了无人机目标追踪稳定性,适合被广泛推广和使用。
技术关键词
深度学习模型
无人机
追踪方法
多模态传感器
特征融合网络
交互机制
模板特征
双模态
多头注意力机制
搜索特征
图像采集模块
视觉
数据
追踪系统
红外相机
云端
系统为您推荐了相关专利信息
三维成像方法
三维定位算法
恒虚警率检测
空间聚类算法
现场可编程门阵列
巡检方法
可见光图像
路径规划算法
识别输电线路
可见光相机
多模态数据融合
无人机
贝叶斯推理方法
生成对抗网络
动态