摘要
本发明公开一种基于可控扩散模型的遥感图像语义分割数据增强方法,包括:基于原始遥感图像,利用视觉‑语言模型生成文本描述,并结合语义分割掩膜中的类别标签构建文本提示;基于原始遥感图像,通过Holistically‑Nested Edge Detection(HED)边缘检测算法生成精细化边缘结构图,并结合语义分割掩膜编码为视觉先验特征;将所述视觉先验通过控制适配器嵌入扩散生成模型,并结合文本提示,生成遥感图像。本发明通过语义引导的扩散过程、多尺度可控生成与视觉先验嵌入,突破现有技术的瓶颈,扩散模型的去噪特性能够生成高保真影像,而条件约束机制可确保增强样本的语义一致性与物理合理性,为遥感语义分割任务提供更优质的数据支撑。
技术关键词
遥感图像语义分割
生成遥感图像
文本
非暂态计算机可读存储介质
边缘检测算法
掩膜
适配器
数据
视觉特征
交叉注意力机制
生成高分辨率
解码器架构
标签
地物类别
噪声预测
多模态
多尺度
系统为您推荐了相关专利信息
自动化构建方法
多信号流图
模式
信号传播路径
自动化故障
条件生成对抗网络
图像增强方法
图像增强模型
隧道
图像拼接