基于视觉多模态的智能航空标识识别方法及系统

AITNT
正文
推荐专利
基于视觉多模态的智能航空标识识别方法及系统
申请号:CN202411662274
申请日期:2024-11-20
公开号:CN119540936A
公开日期:2025-02-28
类型:发明专利
摘要
本发明提供一种基于视觉多模态的智能航空标识识别方法及系统,方法包括:获取待识别飞机图像;根据待识别飞机图像,协同利用目标检测模型和文本识别模型进行目标检测和文本识别,得到标识检测结果和标识识别结果,文本识别模型用于对输入的待识别飞机图像进行特征提取,并基于目标检测模型得到的标识检测结果对提取的文本特征进行文本识别,得到标识识别结果;目标检测模型用于对输入的待识别飞机图像进行特征提取,并基于提取的图像特征和文本特征进行多模态特征融合,以对融合特征进行目标检测,得到标识检测结果。本发明通过协同利用目标检测模型和文本识别模型,以实现多任务高效协同处理,提高模型在不同场景下的鲁棒性,减少误报和漏报情况。
技术关键词
识别飞机 文本识别模型 标识识别方法 多模态特征融合 融合特征 识别标签 航空 视觉 图像特征提取 特征金字塔 置信度阈值 标识识别系统 字符 非暂态计算机可读存储介质
系统为您推荐了相关专利信息
1
一种建筑工程进度监控系统及方法
三维模型 文本 神经网络模型 对象 报告
2
一种基于YOLOv8改进模型的目标检测方法
检测网络模型 交互特征 检测头 上采样 输出特征
3
多模态特征融合的电网设备检测方法、装置和电子设备
融合特征 多模态特征融合 电网设备 物体 多尺度特征融合
4
基于序列模态和图模态的药物靶标亲和力预测方法
多模态特征融合 深度神经网络 序列 药物 亲和力
5
音乐结构分析方法、终端设备及计算机可读存储介质
结构分析方法 音频 融合特征 多任务损失函数 信号
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号