一种基于跨模态同异性交互的多模态情感识别方法

正文

推荐专利

申请号：CN202510676899

申请日期：2025-05-26

公开号：CN120611341A

公开日期：2025-09-09

类型：发明专利

摘要

本申请涉及一种基于跨模态同异性交互的情感识别方法，旨在解决现有多模态情感识别模型中模态间特征交互单一、特异性情感特征丢失以等问题。本申请通过多尺度编码器提取语音、文本和视频模态中的多尺度情感特征，利用中心损失函数增强同类情感特征的聚集性；采用参数共享的Transformer编码器和交叉注意力机制提取模态间同一性情感特征，同时引入正交损失函数保留各模态的特异性情感特征；最后通过双门控融合与增强全局交互模块实现同一性与特异性特征的深度交互，构建更具判别力的情感表征。本申请在IEMOCAP、RAVDESS和eNTERFACE'05数据集上未加权准确率(UA)平均提升1.7％‑5.1％，可广泛应用于心理健康监测、智能客服和人机交互等领域。

技术关键词

情感识别方法情感特征跨模态交叉注意力机制异性模态特征多尺度膨胀卷积多模态情感识别编码器情感类别 Softmax函数损失函数优化智能客服心理健康处理器时域特征文本语音

系统为您推荐了相关专利信息

一种多模态数据自动分类方法、电子设备和存储介质

多模态自动分类方法迁移学习方法样本人机交互界面

一种3D点云大模型对话交互呈现方法、装置及电子设备

呈现方法多任务联合训练稀疏卷积神经网络场景自然语言

一种基于图像多维特征的瓜类种苗特征识别分析方法

识别分析方法语义特征三维点云信息二维图像信息农业机器人

发电机定子局部放电模式的识别方法、装置、设备、存储介质和程序产品

局部放电模式迁移学习模型发电机定子图像分类模型局放数据

一种语音合成方法、装置、设备及介质

坐标语音计算机可读指令球面文本

一种基于跨模态同异性交互的多模态情感识别方法

站点导航

APP 下载