摘要
本发明公开了基于对比‑生成式预训练模型的遥感问答系统,首先搜集分类、语义分割、目标检测、图文检索和图像文本生成等任务的遥感图像作为原始数据,并统一转换为图文对形式。通过分割处理计算类别面积占比,检测目标类别及其位置信息,并通过CLIP模型进行零样本分类。接着,将多源信息输入多模态大语言模型,根据问题生成图像的文本描述,完成遥感全局视觉问答数据集的构造。同时,基于标注框裁切图片并送入多模态大语言模型,以获得遥感局部视觉问答数据集。然后,分由粗到精两阶段预训练对比‑生成式模型,使其具备全局‑局部级遥感知识与视觉问答能力。最后通过构建用户友好的系统界面,实现与用户的问答交互。
技术关键词
预训练模型
问答系统
大语言模型
视觉
数据
多模态
图文
解码器
文本编码器
图像编码器
双编码器
样本
语义
生成方式
构建系统
列表
图片
系统为您推荐了相关专利信息
信号收发模块
温度检测单元
感应模块
监控模块
集成芯片
Cox比例风险模型
异常数据点
贡献率
成分分析
特征值
地图瓦片数据
分辨率
坐标系
数据格式
地理信息系统
模型训练方法
深度学习模型训练
非易失性存储介质
标签
数据完整性验证
故障诊断模型
工况
故障识别方法
识别模块
神经网络模型构建