摘要
本发明提供了一种多源多模态数据融合的跨模态情感识别方法及设备,包括:获取多源模态数据,包括文本、音频和视频;对所述多源模态数据进行预处理,得到预处理后的多源模态数据;利用深度学习模型对预处理后的多源模态数据进行特征提取,得到多源模态特征;通过跨模态注意力机制对所述多源模态特征进行融合,得到融合特征;基于所述融合特征进行情感分类,得到情感识别结果。
技术关键词
情感识别方法
模态特征
融合特征
注意力机制
深度学习模型
非暂态计算机可读存储介质
数据
跨模态
梅尔频率倒谱系数
情感识别装置
输出特征
文本特征向量
双向变换器
音频
通信接口
情感类别
处理器
矩阵
系统为您推荐了相关专利信息
智能分析模型
波形
振动特征
频域特征
多模态深度学习
多尺度卷积神经网络
识别方法
长短期记忆网络
深度学习模型
多模态特征融合
滑移检测方法
电梯曳引轮
图像分割模型
图像采集装置
嵌入式控制板