基于音频和图像的人脸伪造识别方法、装置、设备及介质

AITNT
正文
推荐专利
基于音频和图像的人脸伪造识别方法、装置、设备及介质
申请号:CN202510851017
申请日期:2025-06-24
公开号:CN120356074B
公开日期:2025-08-19
类型:发明专利
摘要
本发明提供了一种基于音频和图像的人脸伪造识别方法、装置、设备及介质,涉及人脸伪造识别技术领域,方法包括提取待识别的人脸视频数据中的图像数据和音频数据,构建全局图像;将全局图像输入至训练好的人脸伪造识别模型中,得到人脸伪造识别结果,其中,人脸伪造识别模型包括:全局特征编码器,用于提取全局图像中图像数据和音频数据的全局特征向量;全局区域编码器,用于构建头部区域特征集合、面部区域特征集合以及唇部特写特征集合;区域感知模块,用于构建权重集合;特征融合模块,用于生成融合特征;多层感知机分类器,用于根据融合特征,输出人脸伪造识别结果。本发明以音频角度和图像角度进行人脸伪造识别,提升了识别的准确性。
技术关键词
伪造识别方法 人脸 图像 音频 感知损失函数 融合特征 数据 残差神经网络 多层感知机 唇部特征 编码器 视频 头部特征 面部特征 注意力机制 分类器 识别装置 模块 存储计算机程序
系统为您推荐了相关专利信息
1
应用于浸没式液冷系统的安全防护方法及系统
浸没式液冷系统 液泵 散热单元 液冷机柜 防护方法
2
基于头戴装置的矿井空间的距离测量方法及系统
头戴装置 计算机执行指令 客户端 矿井 三维模型
3
基于点云与视觉联动的料位高度预警系统及方法
三维点云数据 料仓 策略 数据处理模块 激光扫描单元
4
光子治疗仪
光子治疗仪 头机构 伺服电机 图片识别系统 自动调节机构
5
一种基于大模型的图像生成与风格迁移方法和系统
物体轮廓 语义结构 风格迁移方法 纹理特征 噪声
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号