一种基于去噪扩散模型的多尺度多模态图像条件生成方法

AITNT
正文
推荐专利
一种基于去噪扩散模型的多尺度多模态图像条件生成方法
申请号:CN202411948048
申请日期:2024-12-27
公开号:CN119963673A
公开日期:2025-05-09
类型:发明专利
摘要
本发明公开了一种基于去噪扩散模型的多尺度多模态图像条件生成方法,涉及图像生成领域。本发明有效利用了多模态图像的空间和信息互补性,并基于微调的CLIP文本编码器产生的文本嵌入特征引导生成,有效解决了去噪扩散模型无法有效的生成高保真度的多模态图像、生成的目标与环境条件类型有限的问题,同时在去噪生成的过程中引入了多尺度去噪的策略,实现了单个去噪扩散模型生成的不同尺度图像的能力。
技术关键词
生成方法 多模态 嵌入特征 文本编码器 模糊机制 双三次插值 生成多尺度 全卷积网络 重构 图像结构 模态特征 两阶段 模块 噪声 策略
系统为您推荐了相关专利信息
1
海报生成方法、海报生成装置、电子设备及存储介质
布局特征 注意力 层级 参数 海报生成方法
2
食物价值生成方法、装置、电子设备和计算机可读介质
语义分割信息 图像编码 解码模型 融合特征 标签
3
一种电气作业全生命周期智能安全管控平台
全生命周期智能 管控平台 动态性能参数 模式识别 特征提取模块
4
一种半监督预训练的电力系统对话生成方法
对话生成方法 知识图谱嵌入技术 文本 节点 注意力机制
5
施工计划生成方法、装置、电子设备及存储介质
编码向量 意图 计划生成方法 项目 模版
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号