摘要
本申请适用于情感识别技术领域,提供了一种多模态情感识别方法,该方法包括:获取待测视频数据中包含的多个模态数据的初始模态特征;对多个模态数据的初始模态特征进行融合拼接和时序特征处理,得到多个词汇级别多模态融合特征;然后,对多个词汇级别多模态融合特征进行自注意力加权计算,得到待测视频数据的视频级别多模态融合特征;根据视频级别多模态融合特征对待测视频数据进行情感识别处理,得到待测视频数据对应的情感预测结果。通过将音频模态数据、图像模态数据和文本模态数据的初始模态特征进行融合处理,和通过自注意力加权计算对词汇级别多模态融合特征的关键信息分配更多的权重信息,来提高情感识别的准确率。
技术关键词
融合特征
音频特征
多模态
情感识别方法
文本
时序特征
模态特征
数据
表情特征
视频
图像
语句
注意力机制
双向长短期记忆网络
情感识别技术
自动语音识别
LSTM模型
系统为您推荐了相关专利信息
识别置信度
分页查询技术
语音识别模型
校验规则
财务数据处理技术
情感特征
特征融合网络
生成方法
情感倾向分析
多模态特征
拓扑图
物理
结构健康监测方法
多模态传感器
网络表征