面向语音识别噪声场景下多模态情感分析方法及系统

正文

推荐专利

申请号：CN202411116423

申请日期：2024-08-14

公开号：CN119067123A

公开日期：2024-12-03

类型：发明专利

摘要

本发明涉及面向语音识别噪声场景下多模态情感分析方法及系统，属自然语言处理领域。本发明通过多层次聚类方法，在模态内充分利用样本情感得分信息弥补文本模态在语音识别后损失的情感语义信息，之后在模态间根据不同样本的情感得分信息辅助对比学习进行跨模态情感信息的精炼，最后得到蕴含丰富情感语义的融合模态表示。本发明在包含语音识别噪声的真实世界数据集上进行了广泛实验，结果证明了本发明在面对语音识别噪声干扰时表现出更好的鲁棒性和泛化能力。

技术关键词

情感分析方法语音样本文本噪声跨模态场景情感分析系统标签编码器图像视频情感特征多层感知机聚类方法语义锚点注意力机制

系统为您推荐了相关专利信息

基于深度神经网络的企业财务异常交易识别方法

深度神经网络模型头脑风暴优化算法交易识别方法财务交易数据深度神经网络结构

医患对话转化为病例的方法、装置、设备及存储介质

文本患者医疗实体识别自然语言数据存储系统

基于智能AI的在线调解内容推荐方法及系统

内容推荐方法并行蒙特卡洛策略心理生成规则

一种分层分布式AI家庭助理系统

家庭环境感知信息分层分布式架构早期风险预警

一种多模态情绪识别方法

多模态情绪数据音频特征视觉特征情绪识别方法

面向语音识别噪声场景下多模态情感分析方法及系统

站点导航

APP 下载