摘要
本发明公开了一种基于扩散模型进行文本引导可控人像生成方法及系统,首先将文本提示T输入到CLIP模型中,获取文本嵌入vp;然后基于文本嵌入vp,利用文本姿态生成模型G,提取文本引导条件所指定的姿态引导图;接着利用面部微调模型M,细化姿态引导图的面部关键点的初始估计,输出姿态引导图P;最后给定一张输入图片x0,基于姿态引导图P,利用姿态人像编辑模型,生成编辑后的人像。本发明提出的模型在DF‑PASS数据集上的实验结果验证了该模型的有效性,本发明能有效提高生成图像的灵活性和多样性,减少图像局部模糊,增强图像保真度。
技术关键词
人像生成方法
面部关键点
文本
去噪模型
噪声预测
编辑
图像
线性
坐标
样本
生成系统
图片
处理器
纹理
存储装置
分类器
训练集
系统为您推荐了相关专利信息
代码生成方法
自然语言
双轮
数据
训练分类器模型
电网故障诊断
知识图谱补全方法
查询系统
三元组
EM算法
光学遥感图像
图像特征编码
遥感场景图像
图像特征提取
数据处理器