摘要
本发明公开一种考虑交互上下文的跨模态情感识别方法及系统,涉及情感识别技术领域,将图像、音频和文本分别输入至多模态情感识别模型进行处理,得到情感分析结果;多模态情感识别模型包括依次按照顺序连接的多模态特征提取模块、联合跨模态注意力模块和多层感知机;将图像、音频和文本分别输入至多模态特征提取模块,分别得到时序增强空间特征、时序音频特征和时序文本特征,并一并输入至联合跨模态注意力模块得到情感分析结果,通过整合多模态信息融合,在情感分析的精度和鲁棒性方面取得了显著提升,特别是在模态间深层次互动和上下文关联的建模上取得了进展,能够更精准地处理复杂情感场景中的动态变化,增强了各模态间的上下文整合能力。
技术关键词
情感识别方法
时序
特征提取模块
加权特征
多模态情感识别
跨模态
情感识别模型
多层感知机
音频编码器
音频特征提取
空间特征提取
注意力模型
多模态特征
文本编码器
联合注意力机制
多模态信息融合
系统为您推荐了相关专利信息
数据采集模块
超声驱动
多通道
超声层析成像
多模态融合成像
表达式
神经网络结构
轻量级架构
时间偏移量
Viterbi算法
智能匹配系统
卷积网络模型
资源
周期性特征
大数据