摘要
本申请提供一种图文数据增强、文生图模型的训练、图像生成方法。该方法包括:获取初始图文数据训练集,初始图文数据训练集中包括多个第一图像‑文本对;将第一图像‑文本对中的第一文本输入第一文生图模型,得到第一文生图模型输出的第二图像;将第二图像输入图像描述生成模型,得到图像描述生成模型输出的第二文本,将第二图像和第二文本作为第二图像‑文本对;基于第二图像‑文本对和对应的第一图像‑文本对的相似度,以及第二图像‑文本对的特征信息,对多个第二图像‑文本对进行筛选,得到增强图文数据训练集。本申请的方法提高了训练数据的数量和质量,从而使得训练得到的文生图模型生成的图像质量较高。
技术关键词
文本
图文
训练集
美学
计算机执行指令
图像生成方法
数据
关键词
可读存储介质
计算机程序产品
处理器通信
存储器
模块
电子设备
尺寸
场景
系统为您推荐了相关专利信息
语音特征
监督学习模型
文本
说话人模型
语义特征
麻醉深度监护仪
防护方法
存储芯片
数据通信系统
全功能