一种基于状态空间模型跨模态交互的多模态情感识别方法

正文

推荐专利

申请号：CN202411050481

申请日期：2024-08-01

公开号：CN119128578B

公开日期：2025-10-28

类型：发明专利

摘要

本发明公开了一种基于状态空间模型跨模态交互的多模态情感识别方法，属于多模态情感识别技术领域，步骤包括：首先，提取语音和文本的低级特征，并采用对角线版本的结构化状态空间序列模型提取S4D特征，以便充分利用其独特的序列建模能力和鲁棒性的特征提取能力，有效捕获声音和文本数据复杂的时间相关性；其次，为了融合声音和文本的模态特征，本发明提出了多种跨模态融合策略来动态学习模态之间的权重；此外，为了更好地区分不同类别的情感，本发明设计了一个三元组损失，并将其与交叉熵损失相结合，以提高模型在情感分类中的准确性；最后，进行了消融实验，验证了该方法的有效性。本发明有效提升了多模态情感识别系统的性能和泛化能力。

技术关键词

情感识别方法状态空间模型模态特征跨模态三元组损失函数文本多头注意力机制多模态情感识别 sigmoid函数语音交互特征情感识别系统卷积模块样本通道交互注意力特征提取能力捕获声音

系统为您推荐了相关专利信息

多模态大模型驱动的企业全链路智能管控平台

模态特征特征数据库智能管控平台周期性特征数据标签

基于多源数据融合学习的违规行为识别与检测方法及系统

多模态特征融合注意力融合特征损失计算方法图片

基于多模态数据融合和大模型微调的航班延误预测方法

航班延误预测方法多模态数据融合状态空间模型场景机场气象监测系统

一种基于多模态感知的大模型意图识别方法及系统

意图识别方法多模态音频运维意图识别系统

一种洁净空气开关设备故障诊断方法及系统

空气开关设备故障诊断方法双向长短期记忆网络关键故障特征卷积神经网络提取

一种基于状态空间模型跨模态交互的多模态情感识别方法

站点导航

APP 下载