摘要
本公开提供了一种文生图大模型的训练和文生图方法、装置、设备和介质,涉及人工智能领域,具体涉及深度学习、大模型、计算机视觉等技术领域,能够用于生成式搜索、文档智能编辑、智能助手、智能电商等应用领域。具体实现方案为:采用多个图文数据对,依次对文生图大模型执行多个训练阶段;其中,第i个训练阶段待训练的文生图大模型的模型参数是根据第i‑1个训练阶段训练得到的文生图大模型的多套模型参数的评估指标筛选得到的;从最后一个训练阶段训练得到的文生图大模型的多套模型参数中,确定待微调模型参数;基于多个图文数据对中样本图像的质量得分和美学得分,确定第一图文数据对;采用第一图文数据对,对待微调模型参数进行微调。
技术关键词
分辨率提升
图文
阶段
图像
样本
数据
语义相关度
参数
多尺寸
文本编码器
指标
美学
对齐模块
马赛克
场景
序列