摘要
本申请涉及一种基于超图层级对比学习的多模态情感识别方法,对语音数据、文本数据、图像数据分别进行特征提取;基于时间序列,并基于提取出的语音模态特征、文本模态特征、图像模态特征构建节点,以两节点之间的相似度作为边的权重,构建模态互联图;将每个时间步的模态互联图分别聚合为不同的超点,以两超点之间的语义相似度确定超边的生成,构建第一超图;对第一超图分别进行成员掩码和节点掩码,分别得到第二超图、第三超图;基于第一超图、第二超图、第三超图进行多层级对比学习,并计算联合损失;增强三种模态特征的融合特征,得到增强特征,基于联合损失对增强特征进行联合优化,得到多模态情感表示,基于多模态情感表示预测情感识别结果。
技术关键词
模态特征
情感识别方法
融合特征
节点
文本
层级
语音
样本
多模态
图像
多尺度特征提取方法
掩码矩阵
多层感知机
数据
通道注意力机制
网络
BERT模型
门控循环单元
系统为您推荐了相关专利信息
化优化方法
卷积神经网络提取特征
多模态
文本
跨模态
电流接地故障
聚类分析方法
节点
监测方法
历史故障数据
汽车座椅电机
AI语音
调节系统
语音识别模块
语义