摘要
本发明公开了一种基于多模态融合的残疾人情感状态判断方法,属于多模态融合技术领域,包括:步骤一、通过传感器获取用户的音频、视频与生理信号原始数据;对音频、视频与生理信号数据进行预处理;步骤二、识别原始数据,提取得到音频特征数据、视觉特征数据、生理信号特征数据;步骤三、将所述音频特征数据、视觉特征数据、生理信号特征数据应用模态解耦合策略,实现对模态一致性与异质性的学习;步骤四、将分离出的模态特定特征通过自注意力机制进行融合,基于多模态特征来进行情感识别,最终得到情绪变化识别结果。基于多模态信息对情感状态进行判断,提升准确率。
技术关键词
状态判断方法
音频特征数据
生理
信号特征
传感器获取用户
视觉特征
多模态特征
编码器
注意力机制
视频帧特征
图像共享特征
跨模态融合特征
多模态融合技术
神经网络模型
系统为您推荐了相关专利信息
音乐自动生成方法
跨模态
多模态情感识别
音乐自动生成系统
记忆系统
睡眠特征
睡眠期
多功能柔性传感器
柔性传感器阵列
震动马达
舞台机械控制
生理特征数据
屏幕显示参数
旋转铰链
调节屏幕背光亮度
电缆故障检测方法
故障检测模型
矩阵
数据
多头注意力机制
高维特征向量
多维特征数据
监控方法
强化学习算法
LSTM模型