摘要
本申请涉及一种基于跨模态同异性交互的情感识别方法,旨在解决现有多模态情感识别模型中模态间特征交互单一、特异性情感特征丢失以等问题。本申请通过多尺度编码器提取语音、文本和视频模态中的多尺度情感特征,利用中心损失函数增强同类情感特征的聚集性;采用参数共享的Transformer编码器和交叉注意力机制提取模态间同一性情感特征,同时引入正交损失函数保留各模态的特异性情感特征;最后通过双门控融合与增强全局交互模块实现同一性与特异性特征的深度交互,构建更具判别力的情感表征。本申请在IEMOCAP、RAVDESS和eNTERFACE'05数据集上未加权准确率(UA)平均提升1.7%‑5.1%,可广泛应用于心理健康监测、智能客服和人机交互等领域。
技术关键词
情感识别方法
情感特征
跨模态
交叉注意力机制
异性
模态特征
多尺度膨胀卷积
多模态情感识别
编码器
情感类别
Softmax函数
损失函数优化
智能客服
心理健康
处理器
时域特征
文本
语音
系统为您推荐了相关专利信息
多模态
自动分类方法
迁移学习方法
样本
人机交互界面
呈现方法
多任务联合训练
稀疏卷积神经网络
场景
自然语言
识别分析方法
语义特征
三维点云信息
二维图像信息
农业机器人
局部放电模式
迁移学习模型
发电机定子
图像分类模型
局放数据