文生图模型训练方法及装置

正文

推荐专利

文生图模型训练方法及装置

申请号：CN202410731939

申请日期：2024-06-06

公开号：CN118569320B

公开日期：2025-10-10

类型：发明专利

摘要

本公开提供了一种文生图模型训练方法及装置。该方法包括：获取图像数据集，提取图像数据集中各张人物图像的图像描述；利用各张人物图像及其图像描述构建第一训练数据集；从各张人物图像上分割得到各张人物图像的人物面部图像，利用各张人物图像的人物面部图像和图像描述构建第二训练数据集；将第一训练数据集和第二训练数据集按预设比例组合得到第三训练数据集；为U‑Net网络构建多个LoRA分支，得到去噪微调网络，利用CLIP网络中的文本编码器、VAE网络和去噪微调网络构建文生图模型；利用第三训练数据集训练文生图模型，使得文生图模型学习到人物图像和图像描述。采用上述技术手段，解决现有技术中文生图模型生成图像不合预期的问题。

技术关键词

人物面部图像网络注意力文本编码器模型训练方法噪声数据分支解码模型训练装置可读存储介质基础处理器模块参数存储器计算机

系统为您推荐了相关专利信息

一种基于文本引导与多尺度融合的单目深度估计方法及系统

单目深度估计方法图像文本视觉特征残差信息

一种井盖智慧运维管理方法、系统

井盖结构运维管理方法深度学习图像识别亚健康数据

一种基于图强化学习的车联网信息年龄优化方法及系统

发射机队列管理年龄嵌入特征强化学习系统

一种基于生成对抗网络的建筑冷热负荷预测方法

负荷预测模型生成对抗网络一维卷积神经网络计算机可读取存储介质负荷历史数据

一种兔气道原位肿瘤图像处理方法

肿瘤图像处理方法注意力原位混合模块数学模型

文生图模型训练方法及装置

站点导航

APP 下载