一种应用于文本模态缺失场景下的多模态情感识别方法和系统

AITNT
正文
推荐专利
一种应用于文本模态缺失场景下的多模态情感识别方法和系统
申请号:CN202410955253
申请日期:2024-07-17
公开号:CN118823645A
公开日期:2024-10-22
类型:发明专利
摘要
本发明公开了一种应用于文本模态缺失场景下的多模态情感识别方法,包括:获取待检测者的视频与音频,对获取的视频和音频分别进行预处理,以分别获取多个预处理后的人脸视频关键帧和多个梅尔频率倒谱系数MFCC特征,将预处理后的多个人脸视频关键帧和MFCC特征成对输入至预先训练好的情感识别模型中,以获取待检测者的多个情感类别,并对得到的多个情感类别进行One‑Hot编码,以获取多个向量作为最终的情感识别结果。本发明能够解决现有多模态情感识别方法由于文本模态数据在工业场景下难以获取,直接导致情感识别准确率降低的技术问题。
技术关键词
关键帧 情感识别模型 情感识别方法 注意力 跨模态 MFCC特征 人脸 情感类别 音频特征提取 文本 视频特征提取 场景 融合特征 模块 多任务卷积神经网络 MTCNN算法
系统为您推荐了相关专利信息
1
一种基于微调大语言模型的代码静态审查方法及系统
大语言模型 软件静态测试技术 微调方法 规则集 生成结构化数据
2
一种基于CT图像的北京鸭肝脏体积计算方法
北京鸭 体积计算方法 腹部CT图像 肝脏 轻量级神经网络
3
一种大语言模型微调系统
大语言模型 医疗文本数据 微调系统 微调单元 注意力
4
基于mamba脉冲神经网络的低能耗长序列动作识别方法及系统
脉冲神经网络模型 动作识别方法 序列 人体动作识别 离散状态空间
5
一种基于语义和时间约束的教学微视频生成方法及系统
视频生成方法 知识点 教学 决策树算法 哈希算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号