摘要
本发明实施例提供了一种图像生成方法、装置、电子设备以及介质,其中的方法具体包括:生成文本对应的原始构图;确定原始构图中的对象图像、以及所述对象图像对应的目标角色信息;根据原始构图,确定目标角色信息对应的角色掩膜图;根据目标角色信息对应的角色设计图和角色掩膜图,确定角色引导信息;根据原始构图的深度图,确定布局引导信息;根据所述角色引导信息和布局引导信息,引导扩散模型生成目标图像。本发明实施例有效提升同一目标角色在不同分镜下人物形象的一致性。
技术关键词
掩膜
大语言模型
对象
图像生成方法
布局
人脸特征提取
噪声图像
分辨率
二值化图像
深度图
语义向量
边缘检测
图像生成装置
特征提取模型
文本
注意力
通信接口
电子设备
系统为您推荐了相关专利信息
土地利用数据
布局
地理信息系统数据
聚类
公共设施
安全隐患分析方法
多维特征向量
岩体质量指标
三维模型
数据
水资源承载力
决策方法
层次分析法
地理探测器模型
预警系统
视频监控平台
语音对讲方法
标识特征
场景
融合特征