摘要
本发明涉及场景图预测技术领域,特别涉及一种基于视觉语言模型的遥感场景图预测方法及系统,依据场景图预测任务所需掩码元素类型生成对应的遥感场景图预测提示词,所述掩码元素类型包括场景图中的实体类型元素、属性类型元素和关系类型元素;将遥感场景图预测提示词及目标遥感影像输入至目标模型,利用目标模型生成由目标遥感影像中实体元素、属性元素和关系元素组成的三元组格式预测结果;从三元组格式预测输出中提取与遥感场景图预测提示词对应的掩码元素,并将掩码元素填充到场景图中,得到与目标遥感影像对应的完整场景图。本发明能够对实体、属性、关系等进行预测并输出完整的场景图,提升预测准确率及较少数据集训练下的可靠度。
技术关键词
场景
元素
三元组
遥感影像数据
实体
格式
视觉推理
模型预训练
关系
可读存储介质
预测系统
模块
处理器
存储器
计算机
参数
电子设备
系统为您推荐了相关专利信息
异常监测方法
监测算法
监测策略
运动轨迹数据
多模态
信息抽取方法
Word2Vec模型
报告
命名实体识别技术
分词