文本引导的零样本透明图层及分层图像生成方法

AITNT
正文
推荐专利
文本引导的零样本透明图层及分层图像生成方法
申请号:CN202510202270
申请日期:2025-02-24
公开号:CN120070638B
公开日期:2025-11-25
类型:发明专利
摘要
本发明涉及图像处理领域,具体涉及一种文本引导的零样本透明图层及分层图像生成方法,分层图像生成方法包括:输入全局图像文本提示、目标图像尺寸及层文本提示到前景位置信息生成模型,得到前景位置信息;为每个层文本提示生成第一目标图像;根据所有第一目标图像的透明通道,生成软分割掩码;叠加所有第一目标图像,并编码到潜在空间,得到前景叠加潜在特征;随机采样高斯噪声作为初始背景潜在特征。根据软分割掩码,在迭代式去噪过程中混合前景叠加潜在特征与初始背景潜在特征,得到全局图像潜在特征,并解码为第二目标图像。本发明对每个主体对象的位置进行精准控制,增强了模型的图像布局能力;免去了模型训练的步骤,极大节省计算资源。
技术关键词
图像生成方法 噪声 注意力 图像解码器 样本 图像编码器 分层 矩阵 尺寸 文本编码器 对象 代表 图像处理 通道 强度 网络
系统为您推荐了相关专利信息
1
一种基于预训练表征的增量网络流量分类方法及系统
互联网 网络流量分类方法 序列特征 分类器 样本
2
一种高原制氧与健康监测一体化系统
监测一体化系统 制氧机 环境综合指数 中心机房 多模态数据融合
3
一种基于改进Prony的宽频信号测量方法
信号测量方法 线性预测系数 Prony算法 宽频 皮尔逊相关系数
4
一种胰腺癌靶区分割模型的训练方法
循环生成对抗网络 图像生成模型 胰腺癌患者 解码模块 像素
5
一种老旧油气管道泄漏诱因识别方法
历史监测数据 油气 实时监测数据 识别方法 风险
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号