一种基于扩散模型可推广的布局到图像生成方法

正文

推荐专利

申请号：CN202411847228

申请日期：2024-12-16

公开号：CN119722869B

公开日期：2025-11-04

类型：发明专利

摘要

本发明公开了一种基于扩散模型的可推广的布局到图像生成方法，其特点是该方法包括：构建符合自然语言表达的布局‑文本‑图片数据集；获取图像特征、文本特征和噪声图像特征；生成用于训练的语义布局特征；计算损失更新语义布局编码器参数；给定布局‑文本信息生成图片等步骤。本发明与现有技术相比具有可推广其他微调后的扩散模型上的能力，直接应用到使用个性化数据集进行微调后的扩散模型上，通过布局生成个性化的图片，并可以与其他基于扩散模型的可控生成方法一起使用，方法便捷，效果优异，具有良好的应用前景。

技术关键词

注意力地图布局特征图像生成方法语义噪声图像图片文本编码器自然语言大语言模型生成图像特征交叉注意力机制多模态编码器参数图像编码器

系统为您推荐了相关专利信息

非配合性人脸识别方法及装置

人脸识别方法去模糊图像神经网络算法人脸检测模型人脸识别模型

交互方法、装置、电子设备以及存储介质

数据处理路径媒体配置页面节点对象

一种基于场景感知引导网络的遥感图像推理分割方法

分割方法感知损失函数文本场景类别多场景

标准查询方法、装置、设备、介质及产品

图谱查询方法节点大语言模型实体

一种基于去噪模板和抽象语义表示信息的细粒度情感分析方法

细粒度情感分析方法高维特征向量注意力机制自定义模板输入解码器

一种基于扩散模型可推广的布局到图像生成方法

站点导航

APP 下载