融合双向交叉注意力和门控机制的多模态反讽识别方法

正文

推荐专利

申请号：CN202510179968

申请日期：2025-02-19

公开号：CN120105232A

公开日期：2025-06-06

类型：发明专利

摘要

本发明提出一个融合双向交叉注意力和门控机制的多模态反讽识别模型(MSCAG)，对比传统反讽识别模型在融合图文特征时存在的瓶颈，现在方法往往未能充分挖掘模态间深层次的交互信息，为了解决这个问题，通过双向交叉注意力机制分别精炼出文本层和图像层上相关的注意力特征，残差连接整合文本注意力特征与图像及文本的基础特征，以及图像注意力特征与文本和图像基础特征，运用门控机制以增强两种模态间的信息交互和关键区域聚焦。通过上下文特征与局部特征联合实现更可靠的反讽识别。本发明为多模态反讽识别提供了创新的方法，具有重要的实际应用价值，可以应用于社交媒体中网民评论反讽识别。

技术关键词

文本交叉注意力机制联合损失函数识别方法多层注意力机制情感分析方法标签预测值图文融合特征序列更新模型参数前馈神经网络全局平均池化图像编码器上下文特征样本