摘要
本发明公开了一种沙漏视觉Transformer双路编解码网络的伪装目标检测方法,首先,采用沙漏视觉Transformer(Hourglass‑VIT)同时提取多尺度的低层特征和高层特征;其次,采用双路特征金字塔解码器对多尺度特征图进行自顶向下与自底向上的特征融合;然后,采用高‑低交互增强模块挖掘低层与高层特征关联性,获得多尺度关联增强特征图;最后,同时输入多尺度关联增强特征到网络检测头生成伪装目标的预测图,实现图像中伪装目标检测。本发明的方法能够显著提升了多类复杂场景中伪装目标的可辨识性与识别能力,尤其是对小目标、目标边界的检测效果良好。
技术关键词
编解码
沙漏
高层次
输入多尺度
输入解码器
编码器
特征金字塔
视觉
融合特征
网络
二维图像特征
注意力
通道
语义
代表
检测头
多尺度特征
系统为您推荐了相关专利信息
切片
图像检测模型
三维医学影像
图像检测方法
样本
图像生成网络
语义特征
通信方法
比特流
筛选算法
策略学习方法
视觉
接地模块
逻辑
Sigmoid函数