摘要
本申请公开了一种融合多模态特征的情感识别方法、装置、设备及介质,涉及情感识别领域。该方法获取目标情感诱发的多模态数据;多模态数据包括语音信号、发音信号和声门信号;对语音信号进行多分辨率Mel语谱图深度特征的提取,获得语谱图深度特征;对发音信号进行相空间重构,并从相空间重构得到的三维样本空间中提取微积分特征,获得发音特征;提取声门信号的声门特征;采用分级受限玻尔兹曼机融合语谱图深度特征、发音特征和声门特征,获得融合后的多模态特征,进而采用改进堆叠长短期记忆网络进行情感识别,获得目标的情感。本申请能提高情感识别的准确率。
技术关键词
融合多模态特征
情感识别方法
长短期记忆网络
发音特征
受限玻尔兹曼机
语谱图
信号
曲线
多分辨率
重构
采样点
特征提取模块
情感识别装置
语音特征提取
轨迹
横轴
系统为您推荐了相关专利信息
深度学习算法
等效电路模型
分类方法
构建预测模型
电化学阻抗谱
动态预测系统
交通事故风险
预警模块
环境数据采集单元
预测建模
双向长短期记忆网络
注意力机制
异常事件
BiLSTM模型
Attention机制
寿命预测方法
SSA算法
LSTM模型
长短期记忆网络
可靠性预测技术
纠偏系统
粒子群优化算法
水利
掘进参数
三维地质模型