一种基于ViT架构和视觉状态空间模型的舰船检测方法

AITNT
正文
推荐专利
一种基于ViT架构和视觉状态空间模型的舰船检测方法
申请号:CN202411646578
申请日期:2024-11-18
公开号:CN119600408A
公开日期:2025-03-11
类型:发明专利
摘要
本发明提供一种基于ViT架构和视觉状态空间模型的舰船检测方法,包括:改进骨干网络:设计全新的视觉Transformer块,使用部分卷积来作为令牌混合器,使用更少的代价来融合不同空间位置信息;改进特征增强:设计基于视觉状态空间的VSS Attention块,由具有前馈网络的状态空间模型系列组成,通过残差连接,用于增强全局和局部特征,使特征融合模块更好的融合特征。本发明采用基于SSM的VSS Attention块来处理Backbone网络输出特征,并将融合的全局特征通过前向网络进行非线性变换,以提高模型的拟合能力。同时,通过实验验证结果表明,无论是在复杂背景、多尺度以及密集排列场景下的舰船目标检测,本发明的检测效果都比优化前的算法有较高的提升。
技术关键词
舰船检测方法 状态空间模型 视觉 令牌 混合器 融合特征 网络 非线性 输出特征 系列 多尺度 模块 复杂度 场景 算法 通道 参数
系统为您推荐了相关专利信息
1
一种基于二维码的数据分析防伪溯源处理方法及系统
视觉密码 二进制编码数据 防伪溯源 噪声图像 多分辨率特征
2
一种基于图像通信的智能素材推荐方法及系统
素材推荐方法 高层语义特征 多层级特征 推荐系统 图像采集模块
3
一种利用AI驱动的数字出版内容和线上衍生资源表现预测系统
动态反馈系统 预测系统 多模态数据采集 特征工程 时序特征
4
基于语音同步的嘴形动作生成方法
动作生成方法 语音特征 语音同步 动态图像序列 样本
5
基于多模态感知的交通卡口全息识别方法、系统及介质
交通卡口 多模态传感器 空间坐标系转换关系 识别方法 深度学习模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号