文生图大模型的训练和文生图方法、装置、设备和介质

正文

推荐专利

申请号：CN202411505398

申请日期：2024-10-25

公开号：CN119516016B

公开日期：2025-09-30

类型：发明专利

摘要

本公开提供了一种文生图大模型的训练和文生图方法、装置、设备和介质，涉及人工智能领域，具体涉及深度学习、大模型、计算机视觉等技术领域，能够用于生成式搜索、文档智能编辑、智能助手、智能电商等应用领域。具体实现方案为：采用多个图文数据对，依次对文生图大模型执行多个训练阶段；其中，第i个训练阶段待训练的文生图大模型的模型参数是根据第i‑1个训练阶段训练得到的文生图大模型的多套模型参数的评估指标筛选得到的；从最后一个训练阶段训练得到的文生图大模型的多套模型参数中，确定待微调模型参数；基于多个图文数据对中样本图像的质量得分和美学得分，确定第一图文数据对；采用第一图文数据对，对待微调模型参数进行微调。

技术关键词

分辨率提升图文阶段图像样本数据语义相关度参数多尺寸文本编码器指标美学对齐模块马赛克场景序列

文生图大模型的训练和文生图方法、装置、设备和介质

站点导航

APP 下载