摘要
本发明公开了一种基于视频流的愤怒情绪识别方法,属于情绪识别技术领域。本发明通过对来访人员的视频流进行预处理,获得时空对齐的标准化面部图像序列、3D骨架序列以及语音片段;利用3D‑ResNet34网络和微表情光流增强算法对标准化面部图像序列进行特征提取,获得光流面部特征;利用时空图卷积网络对3D骨架序列进行特征提取,获得肢体动作特征;对语音片段进行特征提取,获得语音特征;利用多头时空交叉注意力机制和膨胀时序卷积算法,对所述面部特征、肢体动作特征以及语音特征进行融合处理后,通过动态权重分配分类输出愤怒情绪识别结果。本发明从整体上大幅度提升了系统对愤怒情绪识别的准确性。
技术关键词
情绪识别方法
动作特征
语音特征
面部特征
视频流
序列
光流特征
局部空间特征
MFCC特征
交叉注意力机制
光流场
动态权重分配
融合特征
动作融合
图像
卷积算法
Sigmoid函数
系统为您推荐了相关专利信息
融合特征
语音特征
多模态特征融合
导购方法
语义特征
超分辨率方法
轻量级人脸检测
负载模式
启发式规则
面部
生成方法
图像优化系统
生成对抗式网络
网络模块
视频流图像帧