摘要
本发明公开了一种语义数据驱动的弱小目标视觉检测方法和检测设备,基于检测模型识别目标图像的多模态特征得到弱小目标的边界框坐标,检测模型包括视觉网络、语义网络、多级特征交互增强模块和跨模态信息融合解码器,语义网络基于图像的语义信息提取语义特征,视觉网络基于语义特征提取图像的视觉特征,多级特征交互增强模块将语义特征和视觉特征进行处理得到高阶语义特征和高阶视觉特征,跨模态信息融合解码器将高阶语义特征和高阶视觉特征融合得到目标图像的多模态特征,利用语义信息对视觉特征进行信息互补,实现了弱小目标视觉检测场景下的多模态信息融合,提高弱小目标检测精度。
技术关键词
视觉检测方法
多级特征
语义特征提取
模态特征
交互注意力
语义信息提取
网络
计算机程序指令
解码器
跨模态
计算机程序产品
图像
视觉特征提取
视觉检测设备
模块