基于视听觉协同的情感识别方法及系统

正文

推荐专利

基于视听觉协同的情感识别方法及系统

申请号：CN202511353407

申请日期：2025-09-22

公开号：CN120852890B

公开日期：2025-12-23

类型：发明专利

摘要

本申请涉及情感识别技术领域，其公开了一种基于视听觉协同的情感识别方法及系统，其获取原始视频流和原始音频流，并为视觉模态和听觉模态引入显式的不确定性量化机制，在提取特征的同时，并行地生成评估其可靠性的不确定性序列。进而，以此不确定性序列为核心引导信号，对跨模态交叉注意力融合过程进行动态调制。该机制使得模型能够自适应地抑制不可靠模态的贡献，侧重于高质量信号的交互，从而有效抑制噪声传播，实现鲁棒的多模态信息互补，最终提升情感识别的准确性。

技术关键词

听觉情感识别方法序列注意力视频流时序中间层多层感知机视觉特征编码多模态数据采集情感识别系统情感识别技术音频矩阵乘法运算 LSTM模型跨模态

系统为您推荐了相关专利信息

基于大模型的银行场景化数据可视化大屏生成方法及系统

数据可视化场景化数据可视化大屏银行设备人脸

用于人工智能对话系统的语音识别特征提取与推理方法

推理方法批量神经网络模型人工智能对话系统动态

机器人的控制方法及装置

坐标系序列机械臂矩阵深度相机

动态蛛网和损失函数协作的深度分层多语义数据处理方法

数据处理方法多尺度分层图像语义分割蛛网结构

确定物体位置的方法、装置、电子设备及存储介质

物体鱼眼相机尺寸对象序列

基于视听觉协同的情感识别方法及系统

站点导航

APP 下载