摘要
本申请涉及计算机视觉的技术领域,尤其是涉及一种多模态大模型抗幻觉变化检测方法,包括:确定多个不同时间点对应的遥感图像,调取预先设置的SigLip图像编码器,使用SigLip图像编码器从多个遥感图像中提取对应的时间特征差异;获取与遥感图像相关的文本数据,将文本数据与时间特征差异输入预先训练的多模态大语言模型进行识别,生成的初步变化检测结果,基于CVA‑CICL机制对初步变化检测结果进行修正,获取对应的修正变化检测结果;基于链式思维推理机制将修正变化检测结果分解为多个变化检测任务,并为每个变化检测任务生成对应的候选解决方案,将全部的候选解决方案进行聚合,输出对应的最终变化检测结果。本申请能够提高变化检测的适应性和精确性。
技术关键词
变化检测方法
图像编码器
推理机制
变化检测装置
大语言模型
多模态
文本
像素
多层滤波器
纹理特征
多头注意力机制
校准
综合性
前馈神经网络
变换特征
数据
变换器
计算机视觉
系统为您推荐了相关专利信息
遥感场景分类方法
文本编码器
图像编码器
模态特征
注意力