多模态情绪识别方法、装置、电子设备、存储介质及产品

AITNT
正文
推荐专利
多模态情绪识别方法、装置、电子设备、存储介质及产品
申请号:CN202510906574
申请日期:2025-07-01
公开号:CN120656489A
公开日期:2025-09-16
类型:发明专利
摘要
本申请实施例提供了一种多模态情绪识别方法、装置、电子设备、存储介质及产品,涉及情绪识别技术领域。该方法包括:获取待识别音视频,待识别音视频包括音频流和视频流,对音频流进行分段,得到至少一个音频段,将各音频段输入音频识别模型,得到音频识别结果,根据音频识别结果为情绪结果的目标音频段,在视频流中确定对应的视频段,将视频段输入视频识别模型,得到视频识别结果,基于音频识别结果和视频识别结果,确定待识别音视频的目标情绪结果。本申请实施例使用视频情绪识别辅助音频情绪识别完成对于音视频的情绪识别,避免单一音频识别可能出现的错误,能够提高识别准确性。
技术关键词
视频识别 音频 情绪识别方法 视频段 音视频 多模态情绪 视频特征向量 图像特征向量 图像识别模型 特征工程 视频流 梅尔频率倒谱系数 情绪识别技术 线性预测系数 数据 识别模块 电子设备 分段
系统为您推荐了相关专利信息
1
一种基于AR技术和实景漫游的景点导览系统与方法
景点导览系统 导航模块 自定义地图 智能路线规划 导游
2
基于相位感知平行注意力机制的无监督风电设备叶片故障检测方法
风电设备叶片 故障检测方法 注意力机制 辅助编码器 故障检测模型
3
语音同传方法、装置、介质及设备
语义 音频 大语言模型 语音 递归神经网络模型
4
用于基于经解释的用户意图调整配置的系统和方法
家庭自动化装置 音频输出装置 意图 AI系统 膝上型计算机
5
基于AI和语音数据的用户情绪识别方法
情绪识别方法 情绪识别模型 多模态辅助 自然语言 韵律特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号