一种基于文本、语音和表情动作的多模态情感识别算法

AITNT
正文
推荐专利
一种基于文本、语音和表情动作的多模态情感识别算法
申请号:CN202411722278
申请日期:2024-11-28
公开号:CN119961634A
公开日期:2025-05-09
类型:发明专利
摘要
本发明涉及人工智能、情感计算领域,提出了一种一种基于文本、语音和表情动作的多模态情感识别算法。首先,设计了一种浅层特征提取网络(Sfen)和并行卷积模块(Pconv)提取语音和文本中的情感特征,在表情动作模态中,将提取面部表情和手部动作的序列特征与双向三层含有注意力机制的LSTM模型相结合;其次,为强化模态间的关联性,设计了一种用于优化语音和文本特征融合的交叉注意力模块;最后,提出一种多性能指标下的模态融合方案,整合不同模态的情感识别结果,实现高精度的情感识别。该系统旨在通过融合音频、文本和表情动作等多模态信息,提高情感识别的准确性。
技术关键词
识别算法 文本 情感识别模型 情感特征 word2vec模型 神经网络语言模型 深度学习模型 融合多模态特征 情感状态识别 梅尔频率倒谱系数 语音特征参数 注意力机制 浅层特征提取 长短期记忆网络 数据 分词
系统为您推荐了相关专利信息
1
基于语义偏移的对抗样本生成方法以及系统
样本生成方法 语义特征 大语言模型 文本编码器 分类器
2
一种医学长文本问答方法、装置、电子设备及存储介质
问答方法 大语言模型 文本 语义 注意力
3
知识图谱处理方法、装置、电子设备、存储介质及产品
图谱 异常事件 推理规则 命名实体识别 计算机程序指令
4
一种基于物联网的智能化矿山管理系统及方法
矿山管理系统 物联网传感装置 地下水 识别算法 节点
5
多模态情感识别方法、装置、设备及介质
文本 情感识别方法 情感类别 多模态情感识别 动态更新
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号