一种基于去噪扩散模型的多尺度多模态图像条件生成方法

AITNT
正文
推荐专利
一种基于去噪扩散模型的多尺度多模态图像条件生成方法
申请号:CN202411948048
申请日期:2024-12-27
公开号:CN119963673A
公开日期:2025-05-09
类型:发明专利
摘要
本发明公开了一种基于去噪扩散模型的多尺度多模态图像条件生成方法,涉及图像生成领域。本发明有效利用了多模态图像的空间和信息互补性,并基于微调的CLIP文本编码器产生的文本嵌入特征引导生成,有效解决了去噪扩散模型无法有效的生成高保真度的多模态图像、生成的目标与环境条件类型有限的问题,同时在去噪生成的过程中引入了多尺度去噪的策略,实现了单个去噪扩散模型生成的不同尺度图像的能力。
技术关键词
生成方法 多模态 嵌入特征 文本编码器 模糊机制 双三次插值 生成多尺度 全卷积网络 重构 图像结构 模态特征 两阶段 模块 噪声 策略
系统为您推荐了相关专利信息
1
儿童自适应绘本生成方法、装置、存储介质及程序产品
儿童 图片 偏好特征 生成方法 照相机拍摄
2
一种基于大语言模型的知识检索增强生成方法及其系统
大语言模型 文本 生成方法 知识图谱构建 语句
3
电力无人机多模态全自主巡检方法及系统
自主巡检方法 电力无人机 多模态 巡检数据 兴趣
4
基于进化多任务优化的物流配送路径优化方法
多任务 计算方法 物流配送路径优化 矩阵 状态更新
5
图像生成和图像生成模型的训练方法、系统、设备和介质
图像生成模型 点云 全局特征提取 交叉注意力机制 图像生成方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号