文本引导图像生成方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202510239408

申请日期：2025-03-03

公开号：CN120318348A

公开日期：2025-07-15

类型：发明专利

摘要

本申请提供一种文本引导图像生成方法、装置、电子设备及存储介质。该方法包括：接收用户输入的文本提示词，文本提示词中包括目标图像的画面信息；从文本提示词中提取基础提示词，并根据文本提示词及基础提示词生成多个子提示词，子提示词用于细化目标图像中的主体及背景；根据文本提示词及子提示词中的空间位置信息确定目标图像的画面布局方式；将文本提示词、子提示词及画面布局方式输入至预定的图像生成模型中，利用图像生成模型识别并处理多个主体之间的关系，生成符合文本提示词描述的目标图像。本申请能够避免多属性、多主体之间出现混淆，提升多概念之间的布局合理性，满足复杂场景下的图像生成需求。

技术关键词

图像生成模型布局方式文本图像生成方法变量画面引导图像生成装置分块基础图像生成网络交叉注意力机制元素关系电子设备可读存储介质深度学习模型大语言模型处理器

系统为您推荐了相关专利信息

面向特殊事件的道路客运线路客流预测方法及系统

客流预测系统客流预测方法站点深度强化学习节假日信息

语气识别方法、语气识别模型的训练方法及相关设备

语气识别方法韵律特征文本融合特征语义特征

一种智能呼叫客服系统、方法、计算机设备和存储介质

客服系统计算机可读指令多模态客服方法数据

一种符合物理属性的红外图像生成方法

图像生成方法可见光图像图像生成模型物理速度

基于后处理鉴别器的文本纠错方法、装置、设备及介质

文本纠错方法字符融合策略检查器解码器

文本引导图像生成方法、装置、电子设备及存储介质

站点导航

APP 下载