一种基于多模态的审讯对象情绪变化的识别方法

正文

推荐专利

申请号：CN202410808613

申请日期：2024-06-21

公开号：CN118380020B

公开日期：2024-11-08

类型：发明专利

摘要

本发明公开了一种基于多模态的审讯对象情绪变化的识别方法，包括：获取审讯对象审讯的原始音频和原始视频；对原始音频和原始视频分别分割为多个等时长的音频片段和视频片段，并将音频片段和与其时刻对齐的视频片段作为一个片段组，得到多个时刻对齐的片段组；对每个片段组中的音频片段和视频片段分别进行特征提取，得到各片段组的语音特征向量和视频特征向量；采用基于注意力机制的多模态融合方法对同一个片段组的语音特征向量和视频特征向量进行融合，得到每个片段组的融合特征向量；对每个片段组的融合特征向量进行情绪识别，并对相邻两个片段组的情绪识别结果进行对比，得到审讯对象的情绪变化识别结果。

技术关键词

视频特征向量识别方法视频特征提取多模态交叉注意力机制融合方法对象人脸图像特征音频特征提取融合策略语音特征冗余噪声矩阵

一种基于多模态的审讯对象情绪变化的识别方法

站点导航

APP 下载