一种沙漏视觉Transformer双路编解码网络的伪装目标检测方法

AITNT
正文
推荐专利
一种沙漏视觉Transformer双路编解码网络的伪装目标检测方法
申请号:CN202410956619
申请日期:2024-07-17
公开号:CN118747842A
公开日期:2024-10-08
类型:发明专利
摘要
本发明公开了一种沙漏视觉Transformer双路编解码网络的伪装目标检测方法,首先,采用沙漏视觉Transformer(Hourglass‑VIT)同时提取多尺度的低层特征和高层特征;其次,采用双路特征金字塔解码器对多尺度特征图进行自顶向下与自底向上的特征融合;然后,采用高‑低交互增强模块挖掘低层与高层特征关联性,获得多尺度关联增强特征图;最后,同时输入多尺度关联增强特征到网络检测头生成伪装目标的预测图,实现图像中伪装目标检测。本发明的方法能够显著提升了多类复杂场景中伪装目标的可辨识性与识别能力,尤其是对小目标、目标边界的检测效果良好。
技术关键词
编解码 沙漏 高层次 输入多尺度 输入解码器 编码器 特征金字塔 视觉 融合特征 网络 二维图像特征 注意力 通道 语义 代表 检测头 多尺度特征
系统为您推荐了相关专利信息
1
图像检测及模型训练方法、设备、介质及程序产品
切片 图像检测模型 三维医学影像 图像检测方法 样本
2
基于生成对抗网络的语言类节目人声异态检测方法
生成对抗网络模型 人声 样本 异常数据 音频
3
一种基于残差及自适应编码的图像语义通信方法
图像生成网络 语义特征 通信方法 比特流 筛选算法
4
一种基于编解码器的语音合成方法及相关设备
编解码器 序列 语音 编码 计算机可读指令
5
一种面向视觉生成式反绎学习的元规则选择策略学习方法
策略学习方法 视觉 接地模块 逻辑 Sigmoid函数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号