一种基于视频流与语音的实时情绪识别系统及方法

AITNT
正文
推荐专利
一种基于视频流与语音的实时情绪识别系统及方法
申请号:CN202510016775
申请日期:2025-01-06
公开号:CN119810892A
公开日期:2025-04-11
类型:发明专利
摘要
本发明公开了一种基于视频流与语音的实时情绪识别系统及方法,该系统包括:数据采集模块:用于通过摄像头实时采集用户面部表情的视频帧,同时通过麦克风实时采集用户的语音信号;特征提取模块:用于将视频帧输入卷积神经网络以提取视觉特征,同时将语音信号输入长短期记忆网络以提取时序特征;加权融合模块:用于将视觉特征和时序特征进行加权融合,生成多模态特征向量;情绪识别模块:用于调用外部大模型的API,对视频帧中的情绪进行进一步识别,获取外部大模型反馈的情绪识别结果,并将外部大模型反馈的情绪识别结果与多模态特征向量进行进一步结合,以生成并输出最终的情绪识别结果。本发明能够提高情绪识别的准确性、高效性与实时性。
技术关键词
情绪识别系统 特征提取模块 视觉特征 时序特征 长短期记忆网络 视频流 语音 增量学习算法 视频帧 多模态 数据采集模块 情绪识别方法 情绪识别模型 麦克风 特征提取模型 识别模块 面部 信号 语谱图
系统为您推荐了相关专利信息
1
用于模型训练的方法、装置、设备、存储介质和程序产品
关键词 样本 计算机可执行指令 文本编码器 数据
2
一种大桥桥梁防撞预警方法和装置
桥梁结构 船舶 轨迹预测模型 数据 风险
3
一种基于线性调频分析的多源环境解译方法和装置
数据立方体 调频 解译方法 分数傅里叶变换 跨模态
4
一种智能化信号处理方法及系统
信号处理方法 感知滤波器 动态滤波器 电磁 信号预处理模块
5
一种基于多模态融合的电力违章操作识别的方法
电力作业现场 深度卷积神经网络 可见光图像 作业数据采集 语义
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号