基于多尺度扩散的布局到场景图像生成方法及系统

AITNT
正文
推荐专利
基于多尺度扩散的布局到场景图像生成方法及系统
申请号:CN202410754328
申请日期:2024-06-12
公开号:CN118840440A
公开日期:2024-10-25
类型:发明专利
摘要
本发明提出了基于多尺度扩散的布局到场景图像生成方法及系统,包括:并行采样步骤:包括并行的从布局中采样获取蒙版和提示的步骤以及从随机初始化的采样图像获得采样图像的平均值的步骤;基于采样图像的平均值及获取的蒙版得到蒙版区域及非蒙版区域;对蒙版区域结合图像编码及文本编码获得蒙版区域预测图像的平均分布;区域融合步骤:使用蒙版将蒙版区域预测图像的平均分布和非蒙版区域预测图像的平均分布结合,得到采样图像的平均分布;语义连贯步骤:基于采样图像的平均分布,计算全局图像特征向量与文本特征向量之间的余弦相似度,并利用梯度更新来修改图像,获得采样图像。
技术关键词
图像生成方法 文本特征向量 图像特征向量 多尺度 布局 噪声图像 场景 语义 图像生成系统 计算机装置 处理器 图像编码 采样模块 可读存储介质 存储器 版图
系统为您推荐了相关专利信息
1
面向3D打印的踝足矫形器参数化设计优化方法及系统
医学影像数据 矫形器 有限元网格模型 设计优化方法 三维模型
2
一种基于改进SiamFC的人体头肩小目标跟踪方法
混合高斯模型 特征提取模块 拉普拉斯 通道注意力机制 跟踪方法
3
一种基于汽车充电需求的充电站规划方法和系统
充电站规划方法 调度控制策略 需求预测模型 充电设施配置 城市路网结构
4
一种多模态MRI脑肿瘤图像分割方法
多模态 权重分配策略 特征选择 模态特征 学习算法
5
一种主梁安装标高的确定方法
多任务损失函数 主梁 桥梁建造施工技术 载荷 多尺度特征融合
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号