一种面向遥感多时相场景多任务解译的变化通用模型构建方法

正文

推荐专利

申请号：CN202510402400

申请日期：2025-04-01

公开号：CN120526262A

公开日期：2025-08-22

类型：发明专利

摘要

本发明属于遥感与计算机视觉交叉技术领域，具体涉及一种面向遥感多时相场景多任务解译的变化通用模型构建方法。包括：采用CNN编码器和Vi T编码器编码，用于输入的双时相图像生成双时相视觉token；采用LoRA技术在冻结的多模态大模型的基础上引入可学习参数用于实现遥感变化领域的视觉语言对齐，多模态大模型还用于对输入双时相图像以及文本指令，生成包含多模态信息的文本输出；添加视觉解码器用于对获得的双时相视觉token和获取的文本输出进行高维解码输出变化图；针对上述构建的变化通用模型，采用Adapter微调的方式添加可学习的参数，实现变化通用模型的多任务统一处理功能；基于文本生成损失和分割掩码损失持续训练，优化变化通用模型。

技术关键词

通用模型构建方法多任务编码器视觉特征文本计算机视觉交叉技术大语言模型多模态信息场景注意力参数解码器图像多层次特征跨模态矩阵上采样

系统为您推荐了相关专利信息

建筑外观视觉特征与情绪调节的EEG反馈优化方法和系统

建筑外观反馈优化方法视觉特征情绪特征模型库

基于自适应数据选取与文本融合的半监督伪装目标检测方法

图像深度特征视觉特征提取文本编码器数据线索

一种语义理解方法、装置、设备及介质

对话管理器语义理解方法文本主题标签

一种基于CBERT-MDPCNN模型的警情文本分类方法

文本分类方法文本特征向量警情文本数据分类器模型文本分类器

一种基于大模型引导的时序知识图谱补全方法

知识图谱补全方法知识图谱数据时序实体聚类

一种面向遥感多时相场景多任务解译的变化通用模型构建方法

站点导航

APP 下载