摘要
本申请涉及一种基于跨模态同异性交互的情感识别方法,旨在解决现有多模态情感识别模型中模态间特征交互单一、特异性情感特征丢失以等问题。本申请通过多尺度编码器提取语音、文本和视频模态中的多尺度情感特征,利用中心损失函数增强同类情感特征的聚集性;采用参数共享的Transformer编码器和交叉注意力机制提取模态间同一性情感特征,同时引入正交损失函数保留各模态的特异性情感特征;最后通过双门控融合与增强全局交互模块实现同一性与特异性特征的深度交互,构建更具判别力的情感表征。本申请在IEMOCAP、RAVDESS和eNTERFACE'05数据集上未加权准确率(UA)平均提升1.7%‑5.1%,可广泛应用于心理健康监测、智能客服和人机交互等领域。
技术关键词
情感识别方法
情感特征
跨模态
交叉注意力机制
异性
模态特征
多尺度膨胀卷积
多模态情感识别
编码器
情感类别
Softmax函数
损失函数优化
智能客服
心理健康
处理器
时域特征
文本
语音
系统为您推荐了相关专利信息
融合特征
残差神经网络
局部空间特征
多尺度特征提取
语义特征
性能提升方法
遥感图像数据
局部细节特征
矩阵
多模态
判别方法
多模态特征
动态权重分配
动态门控
样本