一种基于跨模态同异性交互的多模态情感识别方法

AITNT
正文
推荐专利
一种基于跨模态同异性交互的多模态情感识别方法
申请号:CN202510676899
申请日期:2025-05-26
公开号:CN120611341A
公开日期:2025-09-09
类型:发明专利
摘要
本申请涉及一种基于跨模态同异性交互的情感识别方法,旨在解决现有多模态情感识别模型中模态间特征交互单一、特异性情感特征丢失以等问题。本申请通过多尺度编码器提取语音、文本和视频模态中的多尺度情感特征,利用中心损失函数增强同类情感特征的聚集性;采用参数共享的Transformer编码器和交叉注意力机制提取模态间同一性情感特征,同时引入正交损失函数保留各模态的特异性情感特征;最后通过双门控融合与增强全局交互模块实现同一性与特异性特征的深度交互,构建更具判别力的情感表征。本申请在IEMOCAP、RAVDESS和eNTERFACE'05数据集上未加权准确率(UA)平均提升1.7%‑5.1%,可广泛应用于心理健康监测、智能客服和人机交互等领域。
技术关键词
情感识别方法 情感特征 跨模态 交叉注意力机制 异性 模态特征 多尺度膨胀卷积 多模态情感识别 编码器 情感类别 Softmax函数 损失函数优化 智能客服 心理健康 处理器 时域特征 文本 语音
系统为您推荐了相关专利信息
1
一种多模态数据自动分类方法、电子设备和存储介质
多模态 自动分类方法 迁移学习方法 样本 人机交互界面
2
一种3D点云大模型对话交互呈现方法、装置及电子设备
呈现方法 多任务联合训练 稀疏卷积神经网络 场景 自然语言
3
一种基于图像多维特征的瓜类种苗特征识别分析方法
识别分析方法 语义特征 三维点云信息 二维图像信息 农业机器人
4
发电机定子局部放电模式的识别方法、装置、设备、存储介质和程序产品
局部放电模式 迁移学习模型 发电机定子 图像分类模型 局放数据
5
一种语音合成方法、装置、设备及介质
坐标 语音 计算机可读指令 球面 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号