摘要
本发明公开了一种基于Transformer架构的轻量化水下声呐目标检测模型,包括骨干网络、轻量化混合编码器和一个解码器,骨干网络将输入图像的最后三个阶段的特征输入编码器中;编码器将多尺度特征转换为一系列图像特征;解码器融合损失函数WCIoU和NWDLoss,同时捕捉物体的类别和位置信息,通过迭代优化对象查询来生成类别和边界框。本发明骨干网络采用深度可分离卷积TConv降低计算复杂度,并融合指数移动平均与门控注意力机制,显著提升了骨干网络的特征处理与表征能力;基于WCIoU感知的查询选择机制结合NWD损失函数,实现了分类信息与位置信息的协同优化,特别强化了对小目标的检测能力。
技术关键词
水下声呐
混合编码器
跨尺度特征融合
解码器
高斯分布模型
注意力机制
高效多尺度
输出特征
网络
模块
图像
代表
指数
物体
对象
复杂度
阶段
因子
系统为您推荐了相关专利信息
电功率预测方法
前馈神经网络
风电功率预测模型
多头注意力机制
编码器
多分辨率遥感影像
地表覆盖分类
上采样
视觉特征
金字塔池化模块
手型
序列模板
轨迹匹配算法
无监督聚类
自定义手势
图像标注方法
交叉注意力机制
多模态特征
文本
计算机程序产品