摘要
本申请公开了一种图像篡改检测大模型训练方法及电子设备,图像篡改检测大模型包括:大语言模型、视觉编码器、分割解码器、视觉文本映射器、分类层和定位结构;在预训练阶段,冻结大语言模型、视觉编码器以及视觉文本映射器的参数,通过带有篡改分类信息和篡改定位结果的样本数据训练分割解码器、分类层和定位结构的参数;在分类训练阶段,冻结大语言模型和视觉编码器的参数,将样本数据转化成带有篡改分类结果和篡改定位特征的文本信息,训练分割解码器、视觉文本映射器、分类层和定位结构的参数;在任务训练阶段,解冻图像篡改检测大模型的全局结构,通过带有篡改分类结果的样本数据微调图像篡改检测大模型的所有参数。
技术关键词
大语言模型
识别人脸图像
样本
文本
模型训练方法
解码器
视觉
线性
图像篡改检测方法
阶段
参数
图像篡改区域
像素
定位特征
数据
电子设备
灰度共生矩阵
系统为您推荐了相关专利信息
图像识别方法
中心服务器
标签类别
保护用户隐私
随机梯度下降
边缘计算方法
评分机制
样本
偏移特征
知识蒸馏优化
图像处理模型
图像解码器
分布特征
模型训练方法
文本
关联文件
软件缺陷定位方法
关键词
语义相关度
文本