一种基于ViT架构和视觉状态空间模型的舰船检测方法

正文

推荐专利

申请号：CN202411646578

申请日期：2024-11-18

公开号：CN119600408A

公开日期：2025-03-11

类型：发明专利

摘要

本发明提供一种基于ViT架构和视觉状态空间模型的舰船检测方法，包括：改进骨干网络：设计全新的视觉Transformer块，使用部分卷积来作为令牌混合器，使用更少的代价来融合不同空间位置信息；改进特征增强：设计基于视觉状态空间的VSS Attention块，由具有前馈网络的状态空间模型系列组成，通过残差连接，用于增强全局和局部特征，使特征融合模块更好的融合特征。本发明采用基于SSM的VSS Attention块来处理Backbone网络输出特征，并将融合的全局特征通过前向网络进行非线性变换，以提高模型的拟合能力。同时，通过实验验证结果表明，无论是在复杂背景、多尺度以及密集排列场景下的舰船目标检测，本发明的检测效果都比优化前的算法有较高的提升。

技术关键词

舰船检测方法状态空间模型视觉令牌混合器融合特征网络非线性输出特征系列多尺度模块复杂度场景算法通道参数

系统为您推荐了相关专利信息

一种基于二维码的数据分析防伪溯源处理方法及系统

视觉密码二进制编码数据防伪溯源噪声图像多分辨率特征

一种基于图像通信的智能素材推荐方法及系统

素材推荐方法高层语义特征多层级特征推荐系统图像采集模块

一种利用AI驱动的数字出版内容和线上衍生资源表现预测系统

动态反馈系统预测系统多模态数据采集特征工程时序特征

基于语音同步的嘴形动作生成方法

动作生成方法语音特征语音同步动态图像序列样本

基于多模态感知的交通卡口全息识别方法、系统及介质

交通卡口多模态传感器空间坐标系转换关系识别方法深度学习模型

一种基于ViT架构和视觉状态空间模型的舰船检测方法

站点导航

APP 下载