摘要
本发明提供一种情绪识别方法和装置,方法包括:采集人脸视频数据和环境数据;根据采集的人脸视频数据提取图像数据、语音数据和文本数据;从提取的图像数据中提取图像特征和生理信号特征;从提取的语音数据中提取音频特征;从提取的文本数据中提取文本特征;从采集的环境数据中提取环境特征;利用注意力机制将提取的图像特征、生理信号特征、音频特征、文本特征和环境特征进行拼接融合,生成多模态融合特征;将生成的多模态融合特征输入预训练的情绪检测模型进行情绪识别,输出多模态融合特征所属的情绪内容。本发明能够解决现有情绪识别方法,仅使用单模态图片,忽略其他模态数据的问题。
技术关键词
情绪识别方法
融合特征
信号特征
数据
音频特征
非视觉特征
人脸
多模态
文本
图像增强
特征提取模块
注意力机制
通道
生理
视频
深度学习模型
光电容积描记
系统为您推荐了相关专利信息
线上线下
在线学习平台
数字化学习资源
个性化学习路径
虚拟仿真训练
风险预警方法
非结构化文本
分布式数据库
数据采集接口
风险评估规则
核工业机器人
操控设备
空间转换矩阵
远程操控方法
加速度