摘要
本公开提供了一种图像合成模型的构建方法、图像生成方法及其装置,涉及计算机视觉、深度学习、大模型等人工智能技术领域,可应用于AIGC基于人工智能的内容生成等场景。具体实现方案为:获取包括多个人物的样本图像,以及,获取样本图像对应的样本提示词;通过第一处理网络从样本图像中提取每个人物的人物相关特征,人物相关特征包括外观特征图、面部特征图和描述文本向量;通过第二处理网络,将样本提示词转换为提示文本向量;基于样本图像、人物相关特征和提示文本向量对待训练的多模态扩散网络进行训练,得到目标多模态扩散网络,并基于目标多模态扩散网络构建图像合成模型。
技术关键词
多模态
特征提取单元
网络
文本编码器
样本
面部特征
图像生成方法
人脸
图像分割
噪声
解码器
模块
图像生成装置
处理器
人工智能技术
计算机
系统为您推荐了相关专利信息
文本
语句
知识问答方法
卷积神经网络模型
电子设备
文本生成器
多头注意力机制
多层次特征融合
多模态
双向注意力机制
测试机器人
机械臂控制系统
语音
渗透测试方法
多模态
土壤水分反演方法
水云模型
后向散射系数
归一化植被指数
多模态图像配准方法