摘要
本发明公开了一种基于视频流与语音的实时情绪识别系统及方法,该系统包括:数据采集模块:用于通过摄像头实时采集用户面部表情的视频帧,同时通过麦克风实时采集用户的语音信号;特征提取模块:用于将视频帧输入卷积神经网络以提取视觉特征,同时将语音信号输入长短期记忆网络以提取时序特征;加权融合模块:用于将视觉特征和时序特征进行加权融合,生成多模态特征向量;情绪识别模块:用于调用外部大模型的API,对视频帧中的情绪进行进一步识别,获取外部大模型反馈的情绪识别结果,并将外部大模型反馈的情绪识别结果与多模态特征向量进行进一步结合,以生成并输出最终的情绪识别结果。本发明能够提高情绪识别的准确性、高效性与实时性。
技术关键词
情绪识别系统
特征提取模块
视觉特征
时序特征
长短期记忆网络
视频流
语音
增量学习算法
视频帧
多模态
数据采集模块
情绪识别方法
情绪识别模型
麦克风
特征提取模型
识别模块
面部
信号
语谱图
系统为您推荐了相关专利信息
数据立方体
调频
解译方法
分数傅里叶变换
跨模态
信号处理方法
感知滤波器
动态滤波器
电磁
信号预处理模块
电力作业现场
深度卷积神经网络
可见光图像
作业数据采集
语义