摘要
本发明公开了一种多模态情绪分析方法和装置,涉及情感分析技术领域。方法包括:对多模态情绪数据各模态情绪进行预处理并进行维度对齐,确定目标文本特征、对齐视频特征和对齐音频特征;采用单模态编码器分别对对齐视频特征和对齐音频特征进行编码,对应得到目标视频特征和目标音频特征;通过跨模态融合网络和跨膜态转换网络基于目标文本特征、目标音频特征和目标视频特征进行跨膜态注意力机制运算后输入Transformer网络进行自注意力运算后进行特征融合,确定情绪融合特征;采用情感分类层对情绪融合特征进行情感分类,输出情绪分析结果。基于上述方案,减少了模态交互时的信息丢失,提升了多模态情绪分析的可靠性。
技术关键词
音频特征
情绪分析方法
视频
多模态情绪
注意力机制
变换文本
跨模态
矩阵乘法运算
融合特征
网络
情感分析技术
元素
数据
编码器
处理器
系统为您推荐了相关专利信息
图像修复方法
注意力机制
加权特征
生成对抗网络
分支
医疗大数据
疾病
融合算法
HIS系统
后台服务器
隐私保护特性
健康监测方法
感兴趣
人脸检测定位
集成经验模态分解
学习混合模型
沉降预测方法
开挖地表
多源异构信息
沉降监测数据