摘要
本发明公开了一种基于状态空间模型跨模态交互的多模态情感识别方法,属于多模态情感识别技术领域,步骤包括:首先,提取语音和文本的低级特征,并采用对角线版本的结构化状态空间序列模型提取S4D特征,以便充分利用其独特的序列建模能力和鲁棒性的特征提取能力,有效捕获声音和文本数据复杂的时间相关性;其次,为了融合声音和文本的模态特征,本发明提出了多种跨模态融合策略来动态学习模态之间的权重;此外,为了更好地区分不同类别的情感,本发明设计了一个三元组损失,并将其与交叉熵损失相结合,以提高模型在情感分类中的准确性;最后,进行了消融实验,验证了该方法的有效性。本发明有效提升了多模态情感识别系统的性能和泛化能力。
技术关键词
情感识别方法
状态空间模型
模态特征
跨模态
三元组损失函数
文本
多头注意力机制
多模态情感识别
sigmoid函数
语音
交互特征
情感识别系统
卷积模块
样本
通道
交互注意力
特征提取能力
捕获声音
系统为您推荐了相关专利信息
模态特征
特征数据库
智能管控平台
周期性特征
数据标签
多模态特征融合
注意力
融合特征
损失计算方法
图片
航班延误预测方法
多模态数据融合
状态空间模型
场景
机场气象监测系统
空气开关设备
故障诊断方法
双向长短期记忆网络
关键故障特征
卷积神经网络提取