摘要
本申请涉及人脸鉴伪技术领域,公开了一种人脸鉴伪方法、装置、电子设备、存储介质及产品,包括:从待鉴伪视频中提取多模态特征,其中,多模态特征包括视觉特征、音频特征以及文本特征;对多模态特征进行多模态交互,获得交互后多模态特征;根据交互后多模态特征生成待鉴伪视频的人脸鉴伪结果。本申请通过提出基于视频、音频以及文本三种输入的人脸鉴伪框架,从多个维度获取人脸相关信息,有效挖掘不同模态特征间的关联和互补信息,减少单一模态特征的局限性,增强了检测的全面性和准确性。
技术关键词
鉴伪方法
多模态特征
视觉特征
音频特征
卷积模块
多模态交互
人脸关键点
注意力
交互特征
文本
计算机程序产品
视频帧
电子设备
人脸检测器
鉴伪技术
鉴伪装置
系统为您推荐了相关专利信息
多模态用户交互
迁移学习策略
情感特征
视觉特征
语义特征
轨迹分析方法
LSTM模型
手机信令数据
融合特征
遥感影像数据
人交互方法
通道
像素
卷积神经网络识别
建立人脸模型
铁路扣件
视觉特征编码
缺陷检测方法
ROI图像
像素