一种基于多模态条件扩散模型的SAR图像到光学图像转换方法

正文

推荐专利

申请号：CN202510746206

申请日期：2025-06-05

公开号：CN120656173A

公开日期：2025-09-16

类型：发明专利

摘要

本发明提出一种基于多模态条件扩散模型的SAR图像到光学图像转换方法。首先，收集具有配对关系的SAR图像与光学图像数据，确保样本在场景类型、目标结构与图像风格方面具备多样性。其次，采用图像‑语言多模态模型分别生成SAR与光学图像的文本描述，并通过语义解析与融合，构建统一的语言描述，形成包含结构、语义与风格信息的光‑SAR‑文本三模态训练样本集。本发明设计并训练一种多模态条件引导的去噪扩散模型，以原始光学图像的加噪‑去噪重建过程作为优化目标，引入SAR图像、语言描述及风格图像作为多模态提示条件，全面引导生成图像在结构还原、语义对齐与风格呈现方面的表达。

技术关键词

多模态转换方法风格结构先验信息光学图像数据场景交叉注意力机制遥感图像数据语义特征文本编码器噪声预测重建误差训练样本集噪声分量

系统为您推荐了相关专利信息

基于大模型的智能设备维护方法及系统

智能设备实体数据序列关系

一种基于大数据的智能座舱多模态感知交互系统

交互系统显示处理单元接收端信号接收模块多模态

毫米波雷达手势识别的实时动态轨迹追踪方法和系统

轨迹追踪方法点云动态时间规整恒虚警率检测评分机制

一种情感语义多模态抑郁倾向识别系统

抑郁主题识别系统文本语义信息提取

基于多模态感知与区块链的便利店智能管理方法、装置、设备及存储介质

智能管理方法区块链溯源多模态商品图像识别电子价签

一种基于多模态条件扩散模型的SAR图像到光学图像转换方法

站点导航

APP 下载