基于视觉多模态的智能航空标识识别方法及系统

正文

推荐专利

申请号：CN202411662274

申请日期：2024-11-20

公开号：CN119540936A

公开日期：2025-02-28

类型：发明专利

摘要

本发明提供一种基于视觉多模态的智能航空标识识别方法及系统，方法包括：获取待识别飞机图像；根据待识别飞机图像，协同利用目标检测模型和文本识别模型进行目标检测和文本识别，得到标识检测结果和标识识别结果，文本识别模型用于对输入的待识别飞机图像进行特征提取，并基于目标检测模型得到的标识检测结果对提取的文本特征进行文本识别，得到标识识别结果；目标检测模型用于对输入的待识别飞机图像进行特征提取，并基于提取的图像特征和文本特征进行多模态特征融合，以对融合特征进行目标检测，得到标识检测结果。本发明通过协同利用目标检测模型和文本识别模型，以实现多任务高效协同处理，提高模型在不同场景下的鲁棒性，减少误报和漏报情况。

技术关键词

识别飞机文本识别模型标识识别方法多模态特征融合融合特征识别标签航空视觉图像特征提取特征金字塔置信度阈值标识识别系统字符非暂态计算机可读存储介质

系统为您推荐了相关专利信息

一种建筑工程进度监控系统及方法

三维模型文本神经网络模型对象报告

一种基于YOLOv8改进模型的目标检测方法

检测网络模型交互特征检测头上采样输出特征

多模态特征融合的电网设备检测方法、装置和电子设备

融合特征多模态特征融合电网设备物体多尺度特征融合

基于序列模态和图模态的药物靶标亲和力预测方法

多模态特征融合深度神经网络序列药物亲和力

音乐结构分析方法、终端设备及计算机可读存储介质

结构分析方法音频融合特征多任务损失函数信号

基于视觉多模态的智能航空标识识别方法及系统

站点导航

APP 下载