一种噪声环境下基于语音和面部表情的智能情感识别方法

AITNT
正文
推荐专利
一种噪声环境下基于语音和面部表情的智能情感识别方法
申请号:CN202510575373
申请日期:2025-05-06
公开号:CN120510546A
公开日期:2025-08-19
类型:发明专利
摘要
本发明属于人工智能技术领域,具体涉及一种噪声环境下基于语音和面部表情的智能情感识别方法;该方法包括:获取待识别的视频并从中分离出图像序列和音频序列;将图像序列和音频序列输入到训练好的去噪模型中,得到去噪融合特征、去噪图像特征和去噪音频特征;拼接去噪融合特征、去噪图像特征和去噪音频特征,将拼接后的特征输入到神经网络中,得到情感识别结果;本发明能够充分利用面部表情信息和语音情感信息,提供准确的情绪识别功能,同时结合特征去噪方法,有效抑制真实场景中音频噪声和图像噪声对于情感识别的影响,显著提升模型在真实场景下的情感识别效果。
技术关键词
情感识别方法 融合特征 音频特征 编码器结构 无监督 噪声图像 面部 无噪声 序列 语音 特征融合网络 解码器结构 多模态特征 去噪模型 情绪识别功能
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号