摘要
本发明公开了一种基于大语言模型生成杂志封面或内页布局的方法,其特点是该方法包括:a) 利用大语言模型批量生成杂志页面上的元素、位置坐标的文本描述;b) 根据描述内容使用Hyper‑SD将元素逐个生成;c)对于单个物体的生成图,使用PP‑LiteSeg进行弱监督标注;d) 按照生成的元素位置描述,将单个元素组合成一张完整的杂志页面,同时组合他们的弱监督标签;e)使用自标注数据集矫正过的segformor对生成标注进行验证;f)基于众包对打标签的生成数据进行评估。本发明与现有技术相比具有生成速度快、生成图像带有准确标注、生成图像满足人类审美等优点,具有良好的应用前景。
技术关键词
大语言模型
杂志封面
杂志页面
布局
元素
高频特征
物体检测
弱监督方法
图像
语义分割模型
文本
数据
标签
视觉
坐标
人类
抗锯齿
融合特征