摘要
本发明涉及图像处理领域,具体涉及一种文本引导的零样本透明图层及分层图像生成方法,分层图像生成方法包括:输入全局图像文本提示、目标图像尺寸及层文本提示到前景位置信息生成模型,得到前景位置信息;为每个层文本提示生成第一目标图像;根据所有第一目标图像的透明通道,生成软分割掩码;叠加所有第一目标图像,并编码到潜在空间,得到前景叠加潜在特征;随机采样高斯噪声作为初始背景潜在特征。根据软分割掩码,在迭代式去噪过程中混合前景叠加潜在特征与初始背景潜在特征,得到全局图像潜在特征,并解码为第二目标图像。本发明对每个主体对象的位置进行精准控制,增强了模型的图像布局能力;免去了模型训练的步骤,极大节省计算资源。
技术关键词
图像生成方法
噪声
注意力
图像解码器
样本
图像编码器
分层
矩阵
尺寸
文本编码器
对象
代表
图像处理
通道
强度
网络
系统为您推荐了相关专利信息
监测一体化系统
制氧机
环境综合指数
中心机房
多模态数据融合
信号测量方法
线性预测系数
Prony算法
宽频
皮尔逊相关系数
循环生成对抗网络
图像生成模型
胰腺癌患者
解码模块
像素