摘要
本发明提出了基于多尺度扩散的布局到场景图像生成方法及系统,包括:并行采样步骤:包括并行的从布局中采样获取蒙版和提示的步骤以及从随机初始化的采样图像获得采样图像的平均值的步骤;基于采样图像的平均值及获取的蒙版得到蒙版区域及非蒙版区域;对蒙版区域结合图像编码及文本编码获得蒙版区域预测图像的平均分布;区域融合步骤:使用蒙版将蒙版区域预测图像的平均分布和非蒙版区域预测图像的平均分布结合,得到采样图像的平均分布;语义连贯步骤:基于采样图像的平均分布,计算全局图像特征向量与文本特征向量之间的余弦相似度,并利用梯度更新来修改图像,获得采样图像。
技术关键词
图像生成方法
文本特征向量
图像特征向量
多尺度
布局
噪声图像
场景
语义
图像生成系统
计算机装置
处理器
图像编码
采样模块
可读存储介质
存储器
版图
系统为您推荐了相关专利信息
医学影像数据
矫形器
有限元网格模型
设计优化方法
三维模型
混合高斯模型
特征提取模块
拉普拉斯
通道注意力机制
跟踪方法
充电站规划方法
调度控制策略
需求预测模型
充电设施配置
城市路网结构
多模态
权重分配策略
特征选择
模态特征
学习算法
多任务损失函数
主梁
桥梁建造施工技术
载荷
多尺度特征融合