基于多模态行为一致性的伪造人脸视频检测方法及装置、电子设备、存储介质及程序产品

正文

推荐专利

申请号：CN202510752404

申请日期：2025-06-06

公开号：CN120580567B

公开日期：2025-11-11

类型：发明专利

摘要

本公开提供一种基于多模态行为一致性的伪造人脸视频检测方法及装置、电子设备、存储介质及程序产品。所述方法包括：从包括待检测视频信号提取语音特征、面部表情特征和头部动作特征；识别语音情感、面部情感和语义情感；基于各种情感的VAD值序列，计算各种情感之间的情感一致性特征和情感同步性特征，并计算语义内容与面部情感和语音情感之间的情感语义一致性特征；构建跨模态时间依赖图，得到交互特征；利用层次化注意力网络处理语音特征、面部表情特征和头部动作特征，得到时序特征；形成多维度的融合特征向量；利用预设的二分类器处理融合特征向量，得到指示待检测视频信号是否为伪造人脸视频的分类结果。

技术关键词

面部表情特征语音特征动作特征人脸视频检测识别语音情感交互特征语义样本跨模态面部关键点卷积网络模型时序特征同步性面部动作单元特征提取模块关系建模动态时间规整算法判决模块

系统为您推荐了相关专利信息

用于心理危机筛查的信息处理方法及装置

信息处理方法心理动作特征对象面部微表情

无标记视频辅助的强化学习端到端自动驾驶系统和方法

自动驾驶系统视觉层级编码器模块视频

一种多模态情感识别方法及装置

模态特征交叉注意力机制情感识别方法多模态情感识别文本

基于语音的情绪识别方法和装置、电子设备及存储介质

说话人识别音频编码语音识别模型音频解码语音特征

一种深度学习驱动的人像媒体流生成系统

特征提取单元媒体流生成系统交叉注意力机制语音特征提取

基于多模态行为一致性的伪造人脸视频检测方法及装置、电子设备、存储介质及程序产品

站点导航

APP 下载