基于声光图像融合Transformer的水下目标分类方法及相关装置

AITNT
正文
推荐专利
基于声光图像融合Transformer的水下目标分类方法及相关装置
申请号:CN202510098186
申请日期:2025-01-22
公开号:CN120107655B
公开日期:2025-11-21
类型:发明专利
摘要
本发明属于计算机视觉中的图像分类技术领域,公开了一种基于声光图像融合Transformer的水下目标分类方法及相关装置;其中,所述水下目标图像分类方法包括以下步骤:获取待分类的光学及其对应的声学图像;基于所述待分类的声学及光学图像,采用预先训练好的深度图像分类网络进行水下目标分类,获得分类结果。本发明提出声光融合模块进行声光图像融合以及特征提取模块进行特征提取以及特征混合,增强特征的多样性和语义丰富性,进而提高水下目标图像分类准确率,解决了现有技术中存在的单一模态图像特征提取不充分与特征丰富性捕获不足所导致的水下目标图像较高误分类的技术问题。
技术关键词
输出特征 编码器模块 图像分类网络 注意力 声光 校准 编码模块 分类方法 特征提取模块 前馈神经网络 矩阵 风格 通道 补丁 编码器结构 阶段 非暂态计算机可读存储介质
系统为您推荐了相关专利信息
1
一种基于不确定性的自适应查询优化方法及系统
查询优化系统 数据嵌入 交互注意力 查询优化方法 状态空间模型
2
基于超声导波的钢轨损伤定位方法和装置
多通道 损伤定位方法 回波 变分模态分解算法 超声导波
3
基于高频差分空间注意力机制的全色锐化方法及系统
全色锐化方法 注意力机制 多光谱 增广拉格朗日 数学模型
4
基于感染性肺部疾病诊断模型的临床性能验证系统
验证系统 多模态融合技术 肺部疾病诊断 数据管理模块 个人隐私信息
5
基于运动估计引导的多级注意力自适应目标跟踪方法
跟踪方法 运动估计模块 采样模块 全局平均池化 策略
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号