基于声光图像融合Transformer的水下目标分类方法及相关装置

正文

推荐专利

申请号：CN202510098186

申请日期：2025-01-22

公开号：CN120107655B

公开日期：2025-11-21

类型：发明专利

摘要

本发明属于计算机视觉中的图像分类技术领域，公开了一种基于声光图像融合Transformer的水下目标分类方法及相关装置；其中，所述水下目标图像分类方法包括以下步骤：获取待分类的光学及其对应的声学图像；基于所述待分类的声学及光学图像，采用预先训练好的深度图像分类网络进行水下目标分类，获得分类结果。本发明提出声光融合模块进行声光图像融合以及特征提取模块进行特征提取以及特征混合，增强特征的多样性和语义丰富性，进而提高水下目标图像分类准确率，解决了现有技术中存在的单一模态图像特征提取不充分与特征丰富性捕获不足所导致的水下目标图像较高误分类的技术问题。

技术关键词

输出特征编码器模块图像分类网络注意力声光校准编码模块分类方法特征提取模块前馈神经网络矩阵风格通道补丁编码器结构阶段非暂态计算机可读存储介质

系统为您推荐了相关专利信息

一种基于不确定性的自适应查询优化方法及系统

查询优化系统数据嵌入交互注意力查询优化方法状态空间模型

基于超声导波的钢轨损伤定位方法和装置

多通道损伤定位方法回波变分模态分解算法超声导波

基于高频差分空间注意力机制的全色锐化方法及系统

全色锐化方法注意力机制多光谱增广拉格朗日数学模型

基于感染性肺部疾病诊断模型的临床性能验证系统

验证系统多模态融合技术肺部疾病诊断数据管理模块个人隐私信息

基于运动估计引导的多级注意力自适应目标跟踪方法

跟踪方法运动估计模块采样模块全局平均池化策略

基于声光图像融合Transformer的水下目标分类方法及相关装置

站点导航

APP 下载