一种基于视频流与语音的实时情绪识别系统及方法

正文

推荐专利

申请号：CN202510016775

申请日期：2025-01-06

公开号：CN119810892A

公开日期：2025-04-11

类型：发明专利

摘要

本发明公开了一种基于视频流与语音的实时情绪识别系统及方法，该系统包括：数据采集模块：用于通过摄像头实时采集用户面部表情的视频帧，同时通过麦克风实时采集用户的语音信号；特征提取模块：用于将视频帧输入卷积神经网络以提取视觉特征，同时将语音信号输入长短期记忆网络以提取时序特征；加权融合模块：用于将视觉特征和时序特征进行加权融合，生成多模态特征向量；情绪识别模块：用于调用外部大模型的API，对视频帧中的情绪进行进一步识别，获取外部大模型反馈的情绪识别结果，并将外部大模型反馈的情绪识别结果与多模态特征向量进行进一步结合，以生成并输出最终的情绪识别结果。本发明能够提高情绪识别的准确性、高效性与实时性。

技术关键词

情绪识别系统特征提取模块视觉特征时序特征长短期记忆网络视频流语音增量学习算法视频帧多模态数据采集模块情绪识别方法情绪识别模型麦克风特征提取模型识别模块面部信号语谱图

系统为您推荐了相关专利信息

用于模型训练的方法、装置、设备、存储介质和程序产品

关键词样本计算机可执行指令文本编码器数据

一种大桥桥梁防撞预警方法和装置

桥梁结构船舶轨迹预测模型数据风险

一种基于线性调频分析的多源环境解译方法和装置

数据立方体调频解译方法分数傅里叶变换跨模态

一种智能化信号处理方法及系统

信号处理方法感知滤波器动态滤波器电磁信号预处理模块

一种基于多模态融合的电力违章操作识别的方法

电力作业现场深度卷积神经网络可见光图像作业数据采集语义

一种基于视频流与语音的实时情绪识别系统及方法

站点导航

APP 下载