一种多模态大模型抗幻觉变化检测方法

AITNT
正文
推荐专利
一种多模态大模型抗幻觉变化检测方法
申请号:CN202411932200
申请日期:2024-12-26
公开号:CN119888443A
公开日期:2025-04-25
类型:发明专利
摘要
本申请涉及计算机视觉的技术领域,尤其是涉及一种多模态大模型抗幻觉变化检测方法,包括:确定多个不同时间点对应的遥感图像,调取预先设置的SigLip图像编码器,使用SigLip图像编码器从多个遥感图像中提取对应的时间特征差异;获取与遥感图像相关的文本数据,将文本数据与时间特征差异输入预先训练的多模态大语言模型进行识别,生成的初步变化检测结果,基于CVA‑CICL机制对初步变化检测结果进行修正,获取对应的修正变化检测结果;基于链式思维推理机制将修正变化检测结果分解为多个变化检测任务,并为每个变化检测任务生成对应的候选解决方案,将全部的候选解决方案进行聚合,输出对应的最终变化检测结果。本申请能够提高变化检测的适应性和精确性。
技术关键词
变化检测方法 图像编码器 推理机制 变化检测装置 大语言模型 多模态 文本 像素 多层滤波器 纹理特征 多头注意力机制 校准 综合性 前馈神经网络 变换特征 数据 变换器 计算机视觉
系统为您推荐了相关专利信息
1
目标人群选择方法、装置、设备与存储介质
标签 实体 大语言模型 文本 模版
2
直播弹幕实时互动方法、装置、电子设备及存储介质
直播弹幕 白名单 互动方法 大语言模型 关键词
3
一种基于量化的多任务大语言模型服务系统
多任务 服务系统 大语言模型 队列 线性
4
一种域判别注意增强的视觉语言遥感场景分类方法
遥感场景分类方法 文本编码器 图像编码器 模态特征 注意力
5
问答方法、装置、终端、存储介质及程序产品
资源 语句 序列 数据 语义向量
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号