摘要
本发明的一种单图几何纹理联合控制的图像生成方法与终端,接收用户传入的原始图像和文本提示信息,并基于所述原始图像生成人脸子图、关键点图和正面化人脸图像;对所述人脸子图进行特征的提取和处理,生成人脸身份隐向量;基于所述关键点图和所述正面化人脸图像,生成隐空间控制向量;基于所述文本提示信息生成文本嵌入特征;将所述人脸身份隐向量、所述文本嵌入特征以及拼接噪声向量后的所述隐空间控制向量,采用分层选择性特征注入的方式注入扩散变换器模型,并结合解码器生成身份保持图像;所述扩散变换器模型采用低秩适配训练策略训练得到;实现单图驱动,多姿态风格的身份保持图像的可控生成。
技术关键词
图像生成方法
人脸身份
变换器
嵌入特征
联合注意力机制
文本
俯仰角信息
纹理
解码器
人脸关键点检测
正面
人脸特征提取
人脸识别算法
姿态校正
噪声
模型主体
系统为您推荐了相关专利信息
语义分割模型
空间信息分析方法
联合注意力机制
节点
VR全景
人脸识别模型
图像生成模型
人脸图像生成方法
年龄
分类器