摘要
本发明公开了一种多模态情感识别方法及相关设备,通过分层双向多头交叉注意力机制,动态捕捉文本、音频、视觉模态间的互补关系,结合门控网络自适应分配权重,显著提升多模态信息融合的鲁棒性,避免冗余信息干扰,通过双层路由注意力增强单模态表示区分性,解决高维特征冗余;引入改进 Informer 编码器降低计算复杂度,建模全局对话依赖;多模态门控融合模块抑制冗余信息,提高情感识别准确性;样本加权聚焦对比损失缓解类别不平衡,增强对少数类及语义模糊情感样本的识别,本发明解决了现有技术中多模态会话情感识别准确率较低的技术问题,对构建情感对话系统、实现自然人机交互意义重大。
技术关键词
情感识别模型
多头注意力机制
编码特征
情感类别
多模态会话
情感特征
模态特征
跨模态
多模态信息融合
自然人机交互
情感识别系统
关系
面部表情特征
情感识别方法
面部表情识别
交叉注意力机制
语音特征提取
系统为您推荐了相关专利信息
文本编码器
适配器
多头注意力机制
融合特征
跨模态
编码结构
瓶颈结构
超分方法
解码结构
图像全局特征
音频特征
意图识别方法
融合语义
文本特征加权
融合特征
特征提取模块
大数据
数据采集模块
风险
深度学习模型