基于视觉Transformer的军用目标识别方法、装置和程序产品

正文

推荐专利

申请号：CN202411898486

申请日期：2024-12-23

公开号：CN119919919A

公开日期：2025-05-02

类型：发明专利

摘要

本发明提供了一种基于视觉Transformer的军用目标识别方法、装置和程序产品，所述基于视觉Transformer的军用目标识别方法包括：将图像拆成多个图像块后，对每个图像块进行1/2，1/4程度的下采样，从而得到每个图像块的多尺度表示，然后使用可变形卷积对图像块进行特征提取；在完成特征提取后，将从1/4采样上经过可变形卷积得到的特征图使用Pixel shuffle进行上采样，将上采样得到的特征图与1/2采样上经过可变形卷积得到的特征图进行相加，从而使得相加后的特征图既含有细粒度信息，也含有宏观尺度上的结构信息。将该操作在原始图像块上得到的特征图重复后使得该特征图有更丰富的空间信息，最后将三个特征图延展成一维向量后拼接在一起，送入Encoder模块进行目标识别。

技术关键词

线性模块识别方法采样模块卷积模块图像块解码模块视觉上采样图像分割识别装置通信接口处理器存储器计算机程序产品拼接模块注意力计算机设备

系统为您推荐了相关专利信息

基于多模态图像的目标跟踪方法、装置、设备、介质及产品

跟踪方法特征提取模块融合特征多模态输出特征

一种基于风险评分的虚假贸易识别方法及系统

贸易风险识别方法特征信息识别信息提取模型

一种基于视觉语言知识引入的零样本多模态第一视角行为识别方法

视觉特征多模态惯性传感器数据识别方法适配器

基于云边协同的目标病害自动化识别方法及系统

病害特征节点自动化识别方法云端参数

太阳能资源分区边界识别方法、装置、设备及介质

无限高斯混合模型边界识别方法太阳能遥感反演分区

基于视觉Transformer的军用目标识别方法、装置和程序产品

站点导航

APP 下载