一种图像生成模型训练方法及相关设备

正文

推荐专利

一种图像生成模型训练方法及相关设备

申请号：CN202411921331

申请日期：2024-12-25

公开号：CN119851059A

公开日期：2025-04-18

类型：发明专利

摘要

本发明提供了一种图像生成模型训练方法及相关设备，所述方法包括：基于获取的多个行人图像生成第一文本提示和RGBA语义图，第一文本提示中添加有第一行人的身份ID标签；基于构建的训练数据对预设模型进行迭代训练，得到图像生成模型，训练数据包括行人图像、第一文本提示和RGBA语义图组成的第一样本对，图像生成模型用于根据目标对象的输入图像生成目标对象多视角的输出图像。不同场景和视角下的行人图像具有更好的泛化能力，在实际应用中表现更加稳定和可靠，能够生成高质量的目标对象多视角输出图像。

技术关键词

图像生成模型 ID标签文本多视角语义红绿蓝对象距离信息透明度数据可读存储介质计算机程序产品色彩身份训练装置处理器通信

系统为您推荐了相关专利信息

一种基于深度学习的语音对话设备

语音对话设备信噪比估计值语音识别模块图谱特征降噪模块

一种基于单张静态图像的高保真动态场景视频生成方法

动态场景视频高保真视频生成方法深度特征提取生成视频序列

一种基于多模态的代码结构融入大模型方法及系统

代码结构大语言模型多模态生成代码文本编码器

视觉问答多模态大模型建立方法和装置

多模态文本数据视觉模型建立方法

钢结构桥梁锈蚀病害语义分割方法、装置、设备及介质

钢结构桥梁图像块语义分割方法语义分割算法图片

一种图像生成模型训练方法及相关设备

站点导航

APP 下载