摘要
本发明属于计算机视觉中的图像分类技术领域,公开了一种基于声光图像融合Transformer的水下目标分类方法及相关装置;其中,所述水下目标图像分类方法包括以下步骤:获取待分类的光学及其对应的声学图像;基于所述待分类的声学及光学图像,采用预先训练好的深度图像分类网络进行水下目标分类,获得分类结果。本发明提出声光融合模块进行声光图像融合以及特征提取模块进行特征提取以及特征混合,增强特征的多样性和语义丰富性,进而提高水下目标图像分类准确率,解决了现有技术中存在的单一模态图像特征提取不充分与特征丰富性捕获不足所导致的水下目标图像较高误分类的技术问题。
技术关键词
输出特征
编码器模块
图像分类网络
注意力
声光
校准
编码模块
分类方法
特征提取模块
前馈神经网络
矩阵
风格
通道
补丁
编码器结构
阶段
非暂态计算机可读存储介质
系统为您推荐了相关专利信息
查询优化系统
数据嵌入
交互注意力
查询优化方法
状态空间模型
多通道
损伤定位方法
回波
变分模态分解算法
超声导波
全色锐化方法
注意力机制
多光谱
增广拉格朗日
数学模型
验证系统
多模态融合技术
肺部疾病诊断
数据管理模块
个人隐私信息
跟踪方法
运动估计模块
采样模块
全局平均池化
策略