文生图模型训练方法及装置

AITNT
正文
推荐专利
文生图模型训练方法及装置
申请号:CN202410731939
申请日期:2024-06-06
公开号:CN118569320B
公开日期:2025-10-10
类型:发明专利
摘要
本公开提供了一种文生图模型训练方法及装置。该方法包括:获取图像数据集,提取图像数据集中各张人物图像的图像描述;利用各张人物图像及其图像描述构建第一训练数据集;从各张人物图像上分割得到各张人物图像的人物面部图像,利用各张人物图像的人物面部图像和图像描述构建第二训练数据集;将第一训练数据集和第二训练数据集按预设比例组合得到第三训练数据集;为U‑Net网络构建多个LoRA分支,得到去噪微调网络,利用CLIP网络中的文本编码器、VAE网络和去噪微调网络构建文生图模型;利用第三训练数据集训练文生图模型,使得文生图模型学习到人物图像和图像描述。采用上述技术手段,解决现有技术中文生图模型生成图像不合预期的问题。
技术关键词
人物面部图像 网络 注意力 文本编码器 模型训练方法 噪声 数据 分支 解码 模型训练装置 可读存储介质 基础 处理器 模块 参数 存储器 计算机
系统为您推荐了相关专利信息
1
一种基于文本引导与多尺度融合的单目深度估计方法及系统
单目深度估计方法 图像 文本 视觉特征 残差信息
2
一种井盖智慧运维管理方法、系统
井盖结构 运维管理方法 深度学习图像识别 亚健康 数据
3
一种基于图强化学习的车联网信息年龄优化方法及系统
发射机 队列管理 年龄 嵌入特征 强化学习系统
4
一种基于生成对抗网络的建筑冷热负荷预测方法
负荷预测模型 生成对抗网络 一维卷积神经网络 计算机可读取存储介质 负荷历史数据
5
一种兔气道原位肿瘤图像处理方法
肿瘤图像处理方法 注意力 原位 混合模块 数学模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号