图文数据增强、文生图模型的训练、图像生成方法

正文

推荐专利

申请号：CN202410956400

申请日期：2024-07-16

公开号：CN118968214A

公开日期：2024-11-15

类型：发明专利

摘要

本申请提供一种图文数据增强、文生图模型的训练、图像生成方法。该方法包括：获取初始图文数据训练集，初始图文数据训练集中包括多个第一图像‑文本对；将第一图像‑文本对中的第一文本输入第一文生图模型，得到第一文生图模型输出的第二图像；将第二图像输入图像描述生成模型，得到图像描述生成模型输出的第二文本，将第二图像和第二文本作为第二图像‑文本对；基于第二图像‑文本对和对应的第一图像‑文本对的相似度，以及第二图像‑文本对的特征信息，对多个第二图像‑文本对进行筛选，得到增强图文数据训练集。本申请的方法提高了训练数据的数量和质量，从而使得训练得到的文生图模型生成的图像质量较高。

技术关键词

文本图文训练集美学计算机执行指令图像生成方法数据关键词可读存储介质计算机程序产品处理器通信存储器模块电子设备尺寸场景

系统为您推荐了相关专利信息

图文问答的处理方法、装置、计算机设备和可读存储介质

图片文本图文多模态数据库计算机设备

一种卫星影像数据的交互方法、装置及介质

卫星影像数据数据处理指令交互方法视觉文本

一种面向中文生成大型语言模型的偏见攻击方法

面向中文文本自然语言鲁棒性策略

一种智能护理记录生成方法及装置

语音特征监督学习模型文本说话人模型语义特征

一种系统软件防护方法、系统和麻醉深度监护仪

麻醉深度监护仪防护方法存储芯片数据通信系统全功能

图文数据增强、文生图模型的训练、图像生成方法

站点导航

APP 下载