一种基于Mamba与注意力机制的多模态图像融合方法

AITNT
正文
推荐专利
一种基于Mamba与注意力机制的多模态图像融合方法
申请号:CN202510598462
申请日期:2025-05-09
公开号:CN120634874A
公开日期:2025-09-12
类型:发明专利
摘要
本发明涉及图像处理技术领域,且公开了一种基于Mamba与注意力机制的多模态图像融合方法。该方法通过多种模块协同工作,极大提升了多模态图像融合效果,LDC‑金字塔自适应特征融合模块联合SURF算法,全面且稳定地提取多尺度特征,增强了对复杂场景的适应性,SCIEAM模块从通道和空间维度对这些特征进行加权,突出病原体关键特征,VSS block则有效捕捉局部与全局特征,精准融合不同区域和尺度信息,多模态特征融合与精制模块利用SS2D机制和MLP深度优化特征,挖掘多模态特征间的潜在联系,引入的VSS block基于Mamba的优势,降低计算成本,提高推理速度,使整个融合过程更高效,经多尺度残差特征重建模块处理得到的融合图像,能清晰呈现病原体信息,大幅提升畜禽疾病防控水平。
技术关键词
图像融合方法 多模态特征融合 注意力机制 Hessian矩阵 金字塔 模块 生成多尺度 描述符 融合特征 多尺度特征 通道 数字PCR仪 Sigmoid函数 SURF算法 全局平均池化 多层感知器 空洞
系统为您推荐了相关专利信息
1
一种电力设备缺陷检测方法及其系统
电力设备缺陷 量子神经网络 训练深度学习模型 输入流 多尺度特征融合
2
基于视觉大模型语义引导的RGB-T人群计数方法、设备及介质
计数网络模型 计数方法 融合特征 视觉 多级解码器
3
基于多头注意力的弱监督音频分类方法及系统
音频分类方法 多头注意力机制 智能外呼系统 分类网络 机器可读存储介质
4
一种临床技能培训水平评估方法、装置、设备及存储介质
临床技能培训 水平评估方法 多模态 数据 音频特征提取
5
一种基于多模态视频数据的行人识别方法及系统
多模态 行人识别方法 融合特征 特征提取模型 多头注意力机制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号