一种基于联邦视觉语言模型的遥感图像生成方法

AITNT
正文
推荐专利
一种基于联邦视觉语言模型的遥感图像生成方法
申请号:CN202510724762
申请日期:2025-06-03
公开号:CN120635237A
公开日期:2025-09-12
类型:发明专利
摘要
本发明公开了一种基于联邦视觉语言模型的遥感图像生成方法,属于机器学习技术领域,具体包括:各客户端接收文本指令描述;将私有遥感图像数据通过视觉编码器提取多尺度特征图,同时文本指令描述通过语言编码器生成语义嵌入向量;将语义嵌入向量与多尺度特征图输入动态注意力掩码生成器,生成像素级空间权重分布;对多尺度特征图进行加权融合操作,生成文本条件化的视觉特征表示;通过图像解码器生成符合文本指令描述的遥感图像;客户端向中央服务器上传视觉编码器、语言编码器及动态注意力掩码生成器的模型参数增量;中央服务器聚合模型参数增量,将更新后的全局模型参数分发至各客户端;本发明有效提升了遥感图像生成的灵活性与语义一致性。
技术关键词
图像生成方法 语言编码器 编码向量 注意力 文本 客户端 图像解码器 描述符 视觉特征 语义 参数 多尺度特征 热力图 遥感图像数据 分辨率提升 动态 二值化阈值 指令 对象
系统为您推荐了相关专利信息
1
一种基于多上下文感知的情绪分析方法及装置
人物特征 融合特征 图像 场景上下文 情绪分析方法
2
用于确定与交通工具环境相关的时空模式的方法
数据 注意力 存储器 感知系统 计算机系统
3
特征参数的确定方法、装置、设备、存储介质以及车辆
相关度算法 特征提取模型 模式 参数 文本识别模型
4
一种基于双基线的大模型智能体生成内容质量评估方法
样本 主题 排序算法 语义 数据
5
基于物理规律驱动网络的隧道岩体属性评价方法及系统
泊松比 隧道岩体 多源特征 围岩分级 属性评价方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号