摘要
本发明提供一种基于多域特征融合的深度伪造多标签排序定位方法,包括:对序列深度伪造数据集进行预处理;将人脸RGB图像输入基于DINOv2的空间特征提取器中进行空间域特征的提取;将人脸RGB图像利用离散余弦变换分解得到若干个频域系数和频谱,并将得到的频谱展平重塑,使得相同频率的分量分组到一个通道中形成新的输入,然后通过编码器最终将人脸RGB图像原始颜色输入转换为频域的特征表示;利用空间域特征和频域特征,分别通过交叉注意力模块并进行拼接融合操作,形成新的具有空间域和频域的人脸深度伪造图像多域表征,然后输入到图注意力网络中来捕捉不同特征之间的复杂关系。本发明能够实现更准确的深度伪造分析结果。
技术关键词
多域特征
多标签
定位方法
人脸深度
离散余弦变换
前馈神经网络
空间特征提取
频域特征
节点特征
排序损失
sigmoid函数
监督学习框架
图像全局特征
交叉注意力机制
系统为您推荐了相关专利信息
地下管道机器人
机器人位姿
坐标系
加速度
定位方法
全自动物流分拣系统
RFID智能读写器
中央控制器
分拣装置
光电检测开关
硬件木马定位方法
节点
深度学习模型
待测集成电路
集成电路设计综合