摘要
本发明公开了一种基于大模型与小模型协同的多模态篡改信息检测方法,包括以下步骤:给大语言模型设计提示学习模板,大语言模型根据提示学习模板对输入的图像和文本进行领域识别和情感分析,生成篡改领域引导信息及情感分析结果;利用小模型提取所述图像和文本的语义特征及情感特征,通过操纵感知的对比学习损失及交叉注意力机制,生成跨模态语义交互特征和情感交互特征,并挖掘跨模态语义和情感的不一致性线索;将生成的跨模态语义交互特征和情感交互特征输入解码器,生成图像或文本的篡改区域掩码;把所述篡改领域引导信息、篡改区域掩码及多模态交互特征输入大语言模型,生成篡改类别、篡改区域的识别和篡改识别过程的推理依据。
技术关键词
交互特征
信息检测方法
文本
情感特征
大语言模型
语义特征
输入解码器
交叉注意力机制
跨模态
图像特征提取
编码特征
多模态特征融合
样本
模板
线索
编码器
系统为您推荐了相关专利信息
知识推理方法
融合语义
多模态
工业质检
动态权重分配
特征提取模块
图像特征提取
文本特征向量
图像特征向量
检索系统
数据量化方法
并行处理数据
并行处理单元
数值
因子
关键词提取方法
机器可读程序
分词
中文文本
列表