摘要
本发明公开了一种基于多模态大模型的自然保护地和林业遥感图像生成方法,包括构造第一遥感数据集Dc和第二遥感数据集Ds;构造风格迁移网络;构造总损失L,冻结风格迁移网络中第一CLIP图像编码器、第二CLIP图像编码器的权重,用Dc、Ds以最小化L训练风格迁移网络,得到第一风格迁移模型M1;基于M1构造第二风格迁移模型M2,生成最终风格迁移图像。本发明能有效地利用CLIP模型的跨模态学习能力,利用文本生成图像以及将目标风格图的风格特征融合到生成图像中,保证风格的一致性和图像质量,从而优化来了图像内容和风格一致性,确保输出图像在视觉和内容上的高度协调。使管理者能更精准地分析和理解自然保护地和林业区域的动态变化。
技术关键词
图像编码器
图像生成方法
林业遥感
风格
保护地
解码器
多模态
矩阵
文本编码器
文本生成图像
网络
输出特征
文本特征向量
样本
双线性
系统为您推荐了相关专利信息
像素点
图像生成方法
待测结构
图像生成系统
坐标
文本特征向量
文本编码器
图像特征向量
绘画
风格
合规性检测方法
动态更新
非暂态计算机可读存储介质
招投标技术
样本