一种基于联邦视觉语言模型的遥感图像生成方法

正文

推荐专利

申请号：CN202510724762

申请日期：2025-06-03

公开号：CN120635237A

公开日期：2025-09-12

类型：发明专利

摘要

本发明公开了一种基于联邦视觉语言模型的遥感图像生成方法，属于机器学习技术领域，具体包括：各客户端接收文本指令描述；将私有遥感图像数据通过视觉编码器提取多尺度特征图，同时文本指令描述通过语言编码器生成语义嵌入向量；将语义嵌入向量与多尺度特征图输入动态注意力掩码生成器，生成像素级空间权重分布；对多尺度特征图进行加权融合操作，生成文本条件化的视觉特征表示；通过图像解码器生成符合文本指令描述的遥感图像；客户端向中央服务器上传视觉编码器、语言编码器及动态注意力掩码生成器的模型参数增量；中央服务器聚合模型参数增量，将更新后的全局模型参数分发至各客户端；本发明有效提升了遥感图像生成的灵活性与语义一致性。

技术关键词

图像生成方法语言编码器编码向量注意力文本客户端图像解码器描述符视觉特征语义参数多尺度特征热力图遥感图像数据分辨率提升动态二值化阈值指令对象

系统为您推荐了相关专利信息

一种基于多上下文感知的情绪分析方法及装置

人物特征融合特征图像场景上下文情绪分析方法

用于确定与交通工具环境相关的时空模式的方法

数据注意力存储器感知系统计算机系统

特征参数的确定方法、装置、设备、存储介质以及车辆

相关度算法特征提取模型模式参数文本识别模型

一种基于双基线的大模型智能体生成内容质量评估方法

样本主题排序算法语义数据

基于物理规律驱动网络的隧道岩体属性评价方法及系统

泊松比隧道岩体多源特征围岩分级属性评价方法

一种基于联邦视觉语言模型的遥感图像生成方法

站点导航

APP 下载