一种基于文本、语音和表情动作的多模态情感识别算法

正文

推荐专利

申请号：CN202411722278

申请日期：2024-11-28

公开号：CN119961634A

公开日期：2025-05-09

类型：发明专利

摘要

本发明涉及人工智能、情感计算领域，提出了一种一种基于文本、语音和表情动作的多模态情感识别算法。首先，设计了一种浅层特征提取网络(Sfen)和并行卷积模块(Pconv)提取语音和文本中的情感特征，在表情动作模态中，将提取面部表情和手部动作的序列特征与双向三层含有注意力机制的LSTM模型相结合；其次，为强化模态间的关联性，设计了一种用于优化语音和文本特征融合的交叉注意力模块；最后，提出一种多性能指标下的模态融合方案，整合不同模态的情感识别结果，实现高精度的情感识别。该系统旨在通过融合音频、文本和表情动作等多模态信息，提高情感识别的准确性。

技术关键词

识别算法文本情感识别模型情感特征 word2vec模型神经网络语言模型深度学习模型融合多模态特征情感状态识别梅尔频率倒谱系数语音特征参数注意力机制浅层特征提取长短期记忆网络数据分词

系统为您推荐了相关专利信息

基于语义偏移的对抗样本生成方法以及系统

样本生成方法语义特征大语言模型文本编码器分类器

一种医学长文本问答方法、装置、电子设备及存储介质

问答方法大语言模型文本语义注意力

知识图谱处理方法、装置、电子设备、存储介质及产品

图谱异常事件推理规则命名实体识别计算机程序指令

一种基于物联网的智能化矿山管理系统及方法

矿山管理系统物联网传感装置地下水识别算法节点

多模态情感识别方法、装置、设备及介质

文本情感识别方法情感类别多模态情感识别动态更新

一种基于文本、语音和表情动作的多模态情感识别算法

站点导航

APP 下载