摘要
本发明公开了一种基于变换器的姿态引导人物图像合成方法,首先将多张源人物图像和多张目标姿态图像进行图像预处理,构建得到图像数据集,然后构建超图预测变换器的模型框架,包括有多尺度特征提取模块、超图学习模块和融合预测模块;最后对超图预测变换器进行训练,得到训练好的超图预测变换器,采用训练好的超图预测变换器进行目标姿态引导下的人物图像合成,得到人物合成图像。本发明将多模态信息(人物姿态、目标姿态和背景信息)进行有效整合,提高生成图像的质量和细节表现,从而生成更为精细的姿态引导人物合成图像。
技术关键词
变换器
多尺度特征提取
多层感知机
姿态特征
特征提取模型
特征提取模块
残差模块
多尺度特征融合
图像组合
解码器
像素点
数据
节点
关系
框架
尺寸