摘要
本发明提供一种基于视觉多模态的智能航空标识识别方法及系统,方法包括:获取待识别飞机图像;根据待识别飞机图像,协同利用目标检测模型和文本识别模型进行目标检测和文本识别,得到标识检测结果和标识识别结果,文本识别模型用于对输入的待识别飞机图像进行特征提取,并基于目标检测模型得到的标识检测结果对提取的文本特征进行文本识别,得到标识识别结果;目标检测模型用于对输入的待识别飞机图像进行特征提取,并基于提取的图像特征和文本特征进行多模态特征融合,以对融合特征进行目标检测,得到标识检测结果。本发明通过协同利用目标检测模型和文本识别模型,以实现多任务高效协同处理,提高模型在不同场景下的鲁棒性,减少误报和漏报情况。
技术关键词
识别飞机
文本识别模型
标识识别方法
多模态特征融合
融合特征
识别标签
航空
视觉
图像特征提取
特征金字塔
置信度阈值
标识识别系统
字符
非暂态计算机可读存储介质
系统为您推荐了相关专利信息
融合特征
多模态特征融合
电网设备
物体
多尺度特征融合
结构分析方法
音频
融合特征
多任务损失函数
信号