多模态情绪识别方法、装置、电子设备、存储介质及产品

正文

推荐专利

申请号：CN202510906574

申请日期：2025-07-01

公开号：CN120656489A

公开日期：2025-09-16

类型：发明专利

摘要

本申请实施例提供了一种多模态情绪识别方法、装置、电子设备、存储介质及产品，涉及情绪识别技术领域。该方法包括：获取待识别音视频，待识别音视频包括音频流和视频流，对音频流进行分段，得到至少一个音频段，将各音频段输入音频识别模型，得到音频识别结果，根据音频识别结果为情绪结果的目标音频段，在视频流中确定对应的视频段，将视频段输入视频识别模型，得到视频识别结果，基于音频识别结果和视频识别结果，确定待识别音视频的目标情绪结果。本申请实施例使用视频情绪识别辅助音频情绪识别完成对于音视频的情绪识别，避免单一音频识别可能出现的错误，能够提高识别准确性。

技术关键词

视频识别音频情绪识别方法视频段音视频多模态情绪视频特征向量图像特征向量图像识别模型特征工程视频流梅尔频率倒谱系数情绪识别技术线性预测系数数据识别模块电子设备分段

系统为您推荐了相关专利信息

一种基于AR技术和实景漫游的景点导览系统与方法

景点导览系统导航模块自定义地图智能路线规划导游

基于相位感知平行注意力机制的无监督风电设备叶片故障检测方法

风电设备叶片故障检测方法注意力机制辅助编码器故障检测模型

语音同传方法、装置、介质及设备

语义音频大语言模型语音递归神经网络模型

用于基于经解释的用户意图调整配置的系统和方法

家庭自动化装置音频输出装置意图 AI系统膝上型计算机

基于AI和语音数据的用户情绪识别方法

情绪识别方法情绪识别模型多模态辅助自然语言韵律特征

多模态情绪识别方法、装置、电子设备、存储介质及产品

站点导航

APP 下载