注意力聚合与跨模态图融合的无监督多模态情感识别方法

正文

推荐专利

申请号：CN202410980573

申请日期：2024-07-22

公开号：CN119128616A

公开日期：2024-12-13

类型：发明专利

摘要

本发明公开了注意力聚合与跨模态图融合的无监督多模态情感识别方法，具体为：步骤1，获取视频样本的音频模态特征、图像模态特征和文本模态特征；步骤2，获取音频模态特征、图像模态特征和文本模态特征对应的音频向量、图像向量、文本向量；步骤3，构建无监督多模态情感识别模型；步骤4，将音频向量、图像向量、文本向量输入到无监督多模态情感识别模型进行训练，得到模型的最优输出作为最终的特征向量进行预测和分类；步骤5，使用训练好的无监督多模态情感识别模型进行情感识别。本发明解决了现有技术无法处理树或图网络的长距离空间依赖关系，不足以捕获句子中的句法依赖关系，导致模型无法充分利用多模态数据的问题。

技术关键词

模态特征注意力多模态情感识别节点特征跨模态图像解码器音频解码器编码器模块无监督音频编码器代表文本编码器

系统为您推荐了相关专利信息

基于时序共病网络的慢性病进展模式挖掘方法及系统

模式挖掘方法疾病时序网络拓扑特征节点特征

一种跨模态语义解析方法

语义解析方法跨模态听觉情感词典视觉

融合标签间语义相关性的行为规范检测方法、装置及介质

融合标签多标签分支网络语义特征

一种针对数字内容的风险评估方法及装置

融合特征风险评估方法森林模型特征提取技术主题分布特征

基于多任务图像匹配的无人机相对位姿估计方法及装置

位姿估计方法多任务双分支网络图像匹配特征提取模块

注意力聚合与跨模态图融合的无监督多模态情感识别方法

站点导航

APP 下载