一种面向场景文本生成图像的篡改检测与定位方法

正文

推荐专利

申请号：CN202510322902

申请日期：2025-03-19

公开号：CN120894676A

公开日期：2025-11-04

类型：发明专利

摘要

本发明公开了一种面向场景文本生成图像的篡改检测与定位方法，通过深层特征分支、多尺度特征分支和双注意力融合模块构成的模型进行检测与定位，深层特征分支捕捉场景文本生成图像整体的结构关系和高层次语义信息，得到深层特征图输出至双注意力融合模块，多尺度特征分支通过浅层到深层的逐级特征提取方式，提取场景文本生成图像的多尺度特征图输出至双注意力融合模块，双注意力融合模块将深层特征图和多尺度特征图进行局部细节与全局语义信息的充分融合，得到篡改检测结果与分类预测结果；优点是对篡改区域的定位能力强、对复杂背景适应性强、对小尺度篡改区域的检测能力强、对不规则篡改文本的检测能力强，能够在复杂背景中准确定位篡改区域。

技术关键词

文本生成图像多尺度特征注意力模块定位方法场景特征提取方式分支双线性插值融合特征定位篡改区域高层次语义特征网络结构分辨率关系尺寸

系统为您推荐了相关专利信息

高校社交负向情绪表征分析系统

情绪特征分析系统昼夜机器学习模型数据

提高NDIR传感器测量精度方法、设备及存储介质

NDIR传感器环境温度信息线性化电路气体多光路系统

一种基于增强现实和卷积神经网络的脑控机械臂系统

脑电采集设备机械臂系统 AR眼镜开发板路由器

基于大语言模型的知识库问答平台构建方法

平台构建方法知识库问答大语言模型合规性语义分割算法

一种储能系统节能调控方法及系统

蒸发制冷设备节能调控系统冷却液储能系统液体

一种面向场景文本生成图像的篡改检测与定位方法

站点导航

APP 下载