摘要
本发明提供了一种基于音频和图像的人脸伪造识别方法、装置、设备及介质,涉及人脸伪造识别技术领域,方法包括提取待识别的人脸视频数据中的图像数据和音频数据,构建全局图像;将全局图像输入至训练好的人脸伪造识别模型中,得到人脸伪造识别结果,其中,人脸伪造识别模型包括:全局特征编码器,用于提取全局图像中图像数据和音频数据的全局特征向量;全局区域编码器,用于构建头部区域特征集合、面部区域特征集合以及唇部特写特征集合;区域感知模块,用于构建权重集合;特征融合模块,用于生成融合特征;多层感知机分类器,用于根据融合特征,输出人脸伪造识别结果。本发明以音频角度和图像角度进行人脸伪造识别,提升了识别的准确性。
技术关键词
伪造识别方法
人脸
图像
音频
感知损失函数
融合特征
数据
残差神经网络
多层感知机
唇部特征
编码器
视频
头部特征
面部特征
注意力机制
分类器
识别装置
模块
存储计算机程序
系统为您推荐了相关专利信息
浸没式液冷系统
液泵
散热单元
液冷机柜
防护方法
三维点云数据
料仓
策略
数据处理模块
激光扫描单元
光子治疗仪
头机构
伺服电机
图片识别系统
自动调节机构