一种基于大语言模型快速生成杂志封面或内页布局的方法

正文

推荐专利

申请号：CN202411738279

申请日期：2024-11-29

公开号：CN119516043B

公开日期：2025-12-05

类型：发明专利

摘要

本发明公开了一种基于大语言模型生成杂志封面或内页布局的方法，其特点是该方法包括:a) 利用大语言模型批量生成杂志页面上的元素、位置坐标的文本描述；b) 根据描述内容使用Hyper‑SD将元素逐个生成；c)对于单个物体的生成图，使用PP‑LiteSeg进行弱监督标注；d) 按照生成的元素位置描述，将单个元素组合成一张完整的杂志页面，同时组合他们的弱监督标签；e)使用自标注数据集矫正过的segformor对生成标注进行验证；f)基于众包对打标签的生成数据进行评估。本发明与现有技术相比具有生成速度快、生成图像带有准确标注、生成图像满足人类审美等优点，具有良好的应用前景。

技术关键词

大语言模型杂志封面杂志页面布局元素高频特征物体检测弱监督方法图像语义分割模型文本数据标签视觉坐标人类抗锯齿融合特征

一种基于大语言模型快速生成杂志封面或内页布局的方法

站点导航

APP 下载