摘要
本发明提供一种基于ViT架构和视觉状态空间模型的舰船检测方法,包括:改进骨干网络:设计全新的视觉Transformer块,使用部分卷积来作为令牌混合器,使用更少的代价来融合不同空间位置信息;改进特征增强:设计基于视觉状态空间的VSS Attention块,由具有前馈网络的状态空间模型系列组成,通过残差连接,用于增强全局和局部特征,使特征融合模块更好的融合特征。本发明采用基于SSM的VSS Attention块来处理Backbone网络输出特征,并将融合的全局特征通过前向网络进行非线性变换,以提高模型的拟合能力。同时,通过实验验证结果表明,无论是在复杂背景、多尺度以及密集排列场景下的舰船目标检测,本发明的检测效果都比优化前的算法有较高的提升。
技术关键词
舰船检测方法
状态空间模型
视觉
令牌
混合器
融合特征
网络
非线性
输出特征
系列
多尺度
模块
复杂度
场景
算法
通道
参数
系统为您推荐了相关专利信息
视觉密码
二进制编码数据
防伪溯源
噪声图像
多分辨率特征
素材推荐方法
高层语义特征
多层级特征
推荐系统
图像采集模块
动态反馈系统
预测系统
多模态数据采集
特征工程
时序特征
动作生成方法
语音特征
语音同步
动态图像序列
样本
交通卡口
多模态传感器
空间坐标系转换关系
识别方法
深度学习模型