摘要
本公开关于一种文本引导的图像检测方法、系统、设备、介质和程序产品,涉及图像检测技术领域,旨在准确判断图像的真伪。该方法包括:获取训练好的图像描述模型,所述图像描述模型包括图像编码器和多个文本解码器;将图像输入所述图像编码器,得到所述图像的语义图像特征,并将所述语义图像特征和前一文本解码器的输出,输入每一所述文本解码器,得到所述图像的描述文本的文本特征;在所述文本特征引导下,利用提取的所述图像的全局图像特征,基于交叉注意力机制检测所述图像的真伪。
技术关键词
图像检测方法
图像检测模型
文本
图像内容特征
交叉注意力机制
图像编码器
长短期记忆网络
解码器
样本
语义
融合特征
噪声
图像检测系统
状态更新
图像检测技术
计算机程序产品
转换器
系统为您推荐了相关专利信息
代码生成方法
深度学习模型
生成代码
多模态数据采集
策略
数据库查询语言
数据库查询语句
文本
显示端
自然语言转换
情感分析方法
模态特征
文本
多头注意力机制
样本