摘要
本发明公开了一种引入文本模态的语音情感识别方法及相关装置,对两个或两个以上模态的输入数据进行预处理和特征提取;然后送入引入文本模态的语音情感识别模型中,得到最终的情感预测结果;采用模态融合网络,并且利用图神经网络对文本显性情感语义信息进行特征提取,对于文本模态的利用效率更高,可以对多模态表示执行融合操作,通过引入文本辅助网络帮助主网络获取更多有效信息,减少噪声和有害信息的影响。
技术关键词
语音情感识别方法
语音情感识别模型
跨模态
注意力机制
编码模块
语音特征
语音情感识别系统
前馈神经网络
数据
文本编码器
特征提取器
音频
加权特征
划分方法
程序
系统为您推荐了相关专利信息
视频编辑方法
文本
视频帧
Softmax函数
视频编辑技术
视频生成方法
强化学习框架
视频生成模型
场景
文本
深度神经网络模型
样本
数据
注意力机制
非暂态计算机可读存储介质
风险评估方法
污染物浓度超标
水体
风险评估系统
水质采集设备