摘要
本申请提供了一种基于扩散模型和多模态大语言模型的遥感影像超分辨率方法,涉及图像处理技术领域。该方法采用了预训练的稳定扩散模型,该模型是在大规模数据集上训练的,能够实现稳定和详细的超分辨率效果,并具有更快的收敛速度。本申请还使用多模态大语言模型来增强模型的语义理解能力,提供详细的内容描述和纹理描述。本申请还引入了一个额外的分类器,它提供了关于LR的全局信息和简洁信号。这些先验信息通过交叉注意力模块自适应地集成到扩散模型中。最后,通过将稳定扩散模型强大的生成能力与MLLM的语义理解能力相结合,本申请提出的方法在重建遥感图像方面表现出色,在不同数据集上的多个图像质量方面实现了优异的性能。
技术关键词
超分辨率遥感影像
超分辨率方法
大语言模型
文本编码器
样本
分类器
低分辨率遥感图像
纹理
超分辨率装置
噪声
参数
子模块
图像编码
多模态
标签
系统为您推荐了相关专利信息
智能答疑方法
大语言模型
文本
随机噪声
问答模型技术
长短期记忆网络
时间段
乙型肝炎治疗
神经网络模型
数值
沙箱
虚拟机进程信息
模块
恶意样本检测
动态链接库
虚拟对象
生成虚拟形象
样本
计算机程序产品
电子设备