一种噪声环境下基于语音和面部表情的智能情感识别方法

正文

推荐专利

申请号：CN202510575373

申请日期：2025-05-06

公开号：CN120510546A

公开日期：2025-08-19

类型：发明专利

摘要

本发明属于人工智能技术领域，具体涉及一种噪声环境下基于语音和面部表情的智能情感识别方法；该方法包括：获取待识别的视频并从中分离出图像序列和音频序列；将图像序列和音频序列输入到训练好的去噪模型中，得到去噪融合特征、去噪图像特征和去噪音频特征；拼接去噪融合特征、去噪图像特征和去噪音频特征，将拼接后的特征输入到神经网络中，得到情感识别结果；本发明能够充分利用面部表情信息和语音情感信息，提供准确的情绪识别功能，同时结合特征去噪方法，有效抑制真实场景中音频噪声和图像噪声对于情感识别的影响，显著提升模型在真实场景下的情感识别效果。

技术关键词

情感识别方法融合特征音频特征编码器结构无监督噪声图像面部无噪声序列语音特征融合网络解码器结构多模态特征去噪模型情绪识别功能

一种噪声环境下基于语音和面部表情的智能情感识别方法

站点导航

APP 下载