摘要
本发明公开了一种基于多标签扩散模型的宠物图像生成方法,涉及人工智能图像生成技术领域,所述方法包括:对待处理的宠物图像进行特征提取得到宠物图像特征图;对所述特征图输入下采样层进行下采样处理;将下采样处理后的图片信息输入至中间层;将中间层处理后的图片信息输入至上采样层;其中,所述下采样层和上采样层中包括多标签自适应模块,多标签自适应模块,包括:通过第一卷积模块;多标签向量联合叠加模块,第二卷积模块,注意力模块,自动捕捉多标签向量与中间特征之间的关联关系。增加了多标签编码模块和多标签自适应模块,用于引导扩散模型生成具备多标签特征的高质量宠物图像。
技术关键词
多标签
图像生成方法
人工智能图像
中间层
注意力
线性变换矩阵
编码模块
图片
生成技术
积层
体型
颜色
表达式
关系
数学
代表