摘要
本发明提供了一种基于柔性可变形卷积和注意力机制的红外场景分类方法,包括:红外图像输入AFDC‑IRNet模型,模型输出红外图像所属的红外场景分类信息;其中,AFDC‑IRNet模型处理过程包括:红外图像依次经过FDCN1、ReLU1、MAXPool1,输出第一特征图;第一特征图经过DPANet1输出第一网络特征图像;第一网络特征图像依次经过FDCN2、ReLU2、MAXPool2、DPANet2、FDCN3、ReLU3和MAXPool3,输出第三特征图;第三特征图经过Dropout层后进入Dense,输出红外图像所属的红外场景分类信息。本发明通过柔性可变性卷积提升AFDC‑IRNet模型的感受野,扩大AFDC‑IRNet模型的全局性特征感知能力,通过注意力机制让AFDC‑IRNet模型关注红外图像的广域特征信息,提升AFDC‑IRNet模型的图像全局感知和图像语义上下文特征挖掘的能力,进而提升红外场景分类的任务性能。
技术关键词
场景分类方法
注意力机制
网络特征
采样点
柔性
特征提取网络
图像
ReLU函数
Softmax函数
场景类别
表达式
传播算法
语义特征
变量
上下文特征
标签
红外热像仪
数值
系统为您推荐了相关专利信息
高铁列控系统
异常检测方法
多模态
系统异常检测
文本
全局特征提取
识别系统
膀胱癌复发
多模态
多头注意力机制
老年性骨质疏松
应力
椎体压缩骨折
指数
稳定性评估方法