一种引入文本模态的语音情感识别方法及相关装置

正文

推荐专利

申请号：CN202410975728

申请日期：2024-07-19

公开号：CN119028378A

公开日期：2024-11-26

类型：发明专利

摘要

本发明公开了一种引入文本模态的语音情感识别方法及相关装置，对两个或两个以上模态的输入数据进行预处理和特征提取；然后送入引入文本模态的语音情感识别模型中，得到最终的情感预测结果；采用模态融合网络，并且利用图神经网络对文本显性情感语义信息进行特征提取，对于文本模态的利用效率更高，可以对多模态表示执行融合操作，通过引入文本辅助网络帮助主网络获取更多有效信息，减少噪声和有害信息的影响。

技术关键词

语音情感识别方法语音情感识别模型跨模态注意力机制编码模块语音特征语音情感识别系统前馈神经网络数据文本编码器特征提取器音频加权特征划分方法程序

系统为您推荐了相关专利信息

一种LDoS攻击的检测方法及装置

分类器样本计算机可执行指令编码器数据

一种基于扩散模型的零样本文本驱动视频编辑方法

视频编辑方法文本视频帧 Softmax函数视频编辑技术

一种基于扩散模型的视频生成方法

视频生成方法强化学习框架视频生成模型场景文本

目标产品的潜在用户识别方法、装置及存储介质

深度神经网络模型样本数据注意力机制非暂态计算机可读存储介质

一种水体新污染物风险评估方法和系统

风险评估方法污染物浓度超标水体风险评估系统水质采集设备

一种引入文本模态的语音情感识别方法及相关装置

站点导航

APP 下载