一种基于去噪扩散模型的多尺度多模态图像条件生成方法

正文

推荐专利

申请号：CN202411948048

申请日期：2024-12-27

公开号：CN119963673A

公开日期：2025-05-09

类型：发明专利

摘要

本发明公开了一种基于去噪扩散模型的多尺度多模态图像条件生成方法，涉及图像生成领域。本发明有效利用了多模态图像的空间和信息互补性，并基于微调的CLIP文本编码器产生的文本嵌入特征引导生成，有效解决了去噪扩散模型无法有效的生成高保真度的多模态图像、生成的目标与环境条件类型有限的问题，同时在去噪生成的过程中引入了多尺度去噪的策略，实现了单个去噪扩散模型生成的不同尺度图像的能力。

技术关键词

生成方法多模态嵌入特征文本编码器模糊机制双三次插值生成多尺度全卷积网络重构图像结构模态特征两阶段模块噪声策略

系统为您推荐了相关专利信息

海报生成方法、海报生成装置、电子设备及存储介质

布局特征注意力层级参数海报生成方法

食物价值生成方法、装置、电子设备和计算机可读介质

语义分割信息图像编码解码模型融合特征标签

一种电气作业全生命周期智能安全管控平台

全生命周期智能管控平台动态性能参数模式识别特征提取模块

一种半监督预训练的电力系统对话生成方法

对话生成方法知识图谱嵌入技术文本节点注意力机制

施工计划生成方法、装置、电子设备及存储介质

编码向量意图计划生成方法项目模版

一种基于去噪扩散模型的多尺度多模态图像条件生成方法

站点导航

APP 下载