一种基于多模态自适应融合的情感识别方法、系统、设备及存储介质

正文

推荐专利

申请号：CN202510542178

申请日期：2025-04-28

公开号：CN120449096A

公开日期：2025-08-08

类型：发明专利

摘要

本发明公开了一种基于多模态自适应融合的情感识别方法、系统、设备及存储介质，涉及人工智能技术领域，方法包括：选取预训练模型分别提取音频和视频的原始特征，音频用卷积层初步提取，视频经多模块处理并保留时序信息。接着构建注意力模块生成注意力矩阵和交互特征，用该矩阵调整原始特征。再将加权融合后的特征输入卷积网络提取高级时序特征，之后对其在时间维度池化压缩，将音频和视频特征拼接，最后送入全连接层分类器得出情感分类结果；本发明能够动态调整不同特征的权重，从而有效融合音频和视觉特征，以提升情感识别的准确性和鲁棒性，在加权召回率和未加权召回率方面均表现出显著提升，且具有较高的计算效率和可扩展性。

技术关键词

情感识别方法时序特征交互特征多模态计算机可执行指令视觉特征时间序列特征矩阵视频时序信息特征提取模块情感识别系统视频特征提取音频特征提取多头注意力机制

系统为您推荐了相关专利信息

一种基于多模态模型进行视频对象搜索的方法

多模态非易失性存储介质计算机可读指令对象视频流

一种基于车辆交互图时空解耦编码的多模态轨迹预测方法

节点特征解码模块回放模块场景特征编码模块

图像拼接方法、系统、电子设备及存储介质

图像拼接方法拼接缝隙拉普拉斯金字塔像素点特征点

AI智能化审讯教学系统及方法

教学系统嫌疑人生成优化建议策略多模态注意力

一种基于物联网的智能生产设备数字化服务方法及系统

数字孪生模型执行机构控制器多模态传感器综合效能深度强化学习算法

一种基于多模态自适应融合的情感识别方法、系统、设备及存储介质

站点导航

APP 下载