面向不完整多模态情感分析的多模态融合方法及系统

正文

推荐专利

申请号：CN202511077228

申请日期：2025-08-01

公开号：CN120951253A

公开日期：2025-11-14

类型：发明专利

摘要

本发明提出一种面向不完整多模态情感分析的多模态融合方法及系统，将文本、音频和图像原始特征投影至统一潜在空间；在潜在空间中通过最小化Gram矩阵体积使多模态特征几何分布对齐；动态屏蔽部分模态特征，并与其他模态特征一同输入双支路网络；第一支路中通过跨模态注意力机制对齐其他模态特征至屏蔽特征，利用超图结构卷积与多头自注意力，建模模态内部的高阶结构依赖关系，得到第一特征；第二支路中通过软注意力矩阵捕捉模态特征冗余信息并抑制，得到第二特征；基于共享编码器融合第一特征和第二特征得到多模态融合特征。通过扩展模态内特征的分布表达能力，压缩模态间的几何结构偏差，提升在模态缺失条件下的多模态融合鲁棒性和准确率。

技术关键词

模态特征多模态情感分析融合方法径向基核函数注意力机制跨模态编码器矩阵冗余融合特征文本音频归一化模块融合系统对齐模块处理器支路图像

系统为您推荐了相关专利信息

一种基于安防消防一体化的自动报警方法及系统

多模态监控自动报警方法安防消防多模态特征烟感

基于句向量循环的检索相关性模型及其构建方法

交叉注意力机制模型构建方法文本预训练模型 Sigmoid函数

基于定向目标检测与提示分割的遥感地膜提取方法及系统

YOLO模型地膜掩膜遥感影像识别技术对象检测

基于改进Autoformer模型的时序预测方法

时序预测方法离散余弦变换时序预测技术通道注意力机制随机梯度下降

一种基于人工智能的空间域识别方法

识别方法基因表达数据跨模态注意力机制卷积网络模型

面向不完整多模态情感分析的多模态融合方法及系统

站点导航

APP 下载