一种两级交叉注意力的单级门控多模态融合方法

正文

推荐专利

申请号：CN202510679385

申请日期：2025-05-26

公开号：CN120654812A

公开日期：2025-09-16

类型：发明专利

摘要

本发明涉及人工智能技术领域，尤其是指一种两级交叉注意力的单级门控多模态融合方法，包括：将输入文本经过嵌入层和文本编码器，得到文本向量；将输入图像经过图像编码器，得到图像向量；将文本向量和图像向量输入模态特征融合模块，所述模态特征融合模块采用两级交叉注意力的单级门控模态融合机制，输出融合向量；将融合向量经过解码器，得到预测文本。本发明提升了模态间交互的效果，降低了模型产生的幻觉，并且有效降低了模型的计算参数，具有良好的泛用性和实用性。

技术关键词

多模态融合方法注意力文本编码器图像编码器多模态特征融合解码器答案人工智能技术阶段模块数据信号机制线性

系统为您推荐了相关专利信息

以变体Transformer为指导的电力需求预测系统及方法

电力需求预测系统多尺度状态空间模型电力需求量时序

气象大模型与轻量AI协同的多源森林火险动态预警方法

动态预警方法森林火险气象数字高程模型火灾

一种广视角特征融合记忆网络的多目标跟踪算法

广视角轨迹置信度记忆特征提取模型图片特征信息

一种基于计算机视觉的土石混合颗粒级配检测方法及系统

颗粒级配检测方法计算机视觉实例分割模型颗粒级配检测系统图像像素

小波变换增强的混合融合多模态MR合成CT系统及方法

输出特征 CT系统编码器多模态编码块

一种两级交叉注意力的单级门控多模态融合方法

站点导航

APP 下载