摘要
本发明公开了一种基于多模态文本增强的跨域人脸防伪造检测方法及装置,涉及网络信息安全技术领域,方法包括:将两类描述文本输入预训练的文本编码器提取代表真实/欺骗的文本类别特征,将图像输入预训练的视觉编码器提取视觉特征;在文本编码器的每一层添加可训练的文本提示,在视觉编码器的每一层添加可训练的视觉提示,视觉编码器的每一层视觉提示由当前层的文本提示经过全连接层转换得到;将PFT模块及TIM模块嵌入到文本编码器和视觉编码器每一层的中间层实现特征交互融合,获取文本类别特征与视觉特征之间的余弦相似度及掩膜,进行人脸真假类别。本发明基于PFT模块及TIM模块,使得模态特征交互在特征提取的过程中同时完成,提升了跨域检测性能。
技术关键词
文本编码器
视觉特征
图像块特征
多模态
人脸
交叉注意力机制
网络信息安全技术
多层感知器
模块
标签
掩膜
中间层
模态特征
代表
指数
系统为您推荐了相关专利信息
面向多模态数据
攻击检测系统
语义向量
综合故障
多维指标体系
配网变电站
电压控制方法
深度特征提取
多模态
网络拓扑结构
BIM软件
脚本
建模方法
多层级特征
多层感知机
图像生成网络
图像处理网络
服装
生成方法
文本编码器