摘要
本发明涉及面向语音识别噪声场景下多模态情感分析方法及系统,属自然语言处理领域。本发明通过多层次聚类方法,在模态内充分利用样本情感得分信息弥补文本模态在语音识别后损失的情感语义信息,之后在模态间根据不同样本的情感得分信息辅助对比学习进行跨模态情感信息的精炼,最后得到蕴含丰富情感语义的融合模态表示。本发明在包含语音识别噪声的真实世界数据集上进行了广泛实验,结果证明了本发明在面对语音识别噪声干扰时表现出更好的鲁棒性和泛化能力。
技术关键词
情感分析方法
语音
样本
文本
噪声
跨模态
场景
情感分析系统
标签
编码器
图像
视频
情感特征
多层感知机
聚类方法
语义
锚点
注意力机制
系统为您推荐了相关专利信息
深度神经网络模型
头脑风暴优化算法
交易识别方法
财务交易数据
深度神经网络结构
家庭
环境感知信息
分层
分布式架构
早期风险预警
多模态情绪
数据
音频特征
视觉特征
情绪识别方法