一种应用于文本模态缺失场景下的多模态情感识别方法和系统

正文

推荐专利

申请号：CN202410955253

申请日期：2024-07-17

公开号：CN118823645A

公开日期：2024-10-22

类型：发明专利

摘要

本发明公开了一种应用于文本模态缺失场景下的多模态情感识别方法，包括：获取待检测者的视频与音频，对获取的视频和音频分别进行预处理，以分别获取多个预处理后的人脸视频关键帧和多个梅尔频率倒谱系数MFCC特征，将预处理后的多个人脸视频关键帧和MFCC特征成对输入至预先训练好的情感识别模型中，以获取待检测者的多个情感类别，并对得到的多个情感类别进行One‑Hot编码，以获取多个向量作为最终的情感识别结果。本发明能够解决现有多模态情感识别方法由于文本模态数据在工业场景下难以获取，直接导致情感识别准确率降低的技术问题。

技术关键词

关键帧情感识别模型情感识别方法注意力跨模态 MFCC特征人脸情感类别音频特征提取文本视频特征提取场景融合特征模块多任务卷积神经网络 MTCNN算法

系统为您推荐了相关专利信息

一种基于微调大语言模型的代码静态审查方法及系统

大语言模型软件静态测试技术微调方法规则集生成结构化数据

一种基于CT图像的北京鸭肝脏体积计算方法

北京鸭体积计算方法腹部CT图像肝脏轻量级神经网络

一种大语言模型微调系统

大语言模型医疗文本数据微调系统微调单元注意力

基于mamba脉冲神经网络的低能耗长序列动作识别方法及系统

脉冲神经网络模型动作识别方法序列人体动作识别离散状态空间

一种基于语义和时间约束的教学微视频生成方法及系统

视频生成方法知识点教学决策树算法哈希算法

一种应用于文本模态缺失场景下的多模态情感识别方法和系统

站点导航

APP 下载