基于掩码引导的查询式编码器框架的图像篡改定位方法和系统

AITNT
正文
推荐专利
基于掩码引导的查询式编码器框架的图像篡改定位方法和系统
申请号:CN202510154585
申请日期:2025-02-12
公开号:CN120071105A
公开日期:2025-05-30
类型:发明专利
摘要
本发明提供一种基于掩码引导的查询式编码器框架的图像篡改定位方法和系统,使用真值掩码来指导可学习查询令牌(LQT)识别伪造区域,其中包括:提取真值掩码的特征嵌入作为引导查询令牌(GQT)操作;构建基于掩码引导的查询式编码器框架,然后将GQT和LQT分别输入到查询式编码器中来定位篡改区域操作;设计掩码引导损失算法,利用查询式编码器学习真值掩码标签中的位置和形状信息,从而减小GQT和LQT之间的特征距离操作;最后利用训练好的模型对篡改图像进行篡改定位,能够解决基于深度学习的模型在图像篡改定位方面忽略被操纵区域的空间位置和形状细节的问题,提升图像篡改定位的准确率。
技术关键词
编码器框架 图像篡改定位方法 噪声特征 多模态特征 令牌 特征提取器 双线性 存储程序代码 上采样 多分支 定位篡改区域 注意力机制 定位系统 可读存储介质
系统为您推荐了相关专利信息
1
一种多模态大模型的全自动标注方法及系统
多模态特征融合 标注方法 图片 融合特征 模块
2
基于多模态特征融合匹配的具身智能体平面定位方法及系统
激光雷达扫描数据 平面定位方法 栅格地图 激光雷达数据 多模态特征融合
3
基于多模态融合的电磁传播损耗预测方法及系统
表格特征 损耗 交叉注意力机制 电磁 多模态特征融合
4
一种智能烧伤创面动态监测与评估系统
评估系统 动态 注意力 烧伤创面治疗 多模态特征融合
5
一种基于多源多表示信息融合的3D目标检测方法
距离图像 图像特征索引方法 坐标 多模态特征 多尺度特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号