一种基于大语言模型快速生成杂志封面或内页布局的方法

AITNT
正文
推荐专利
一种基于大语言模型快速生成杂志封面或内页布局的方法
申请号:CN202411738279
申请日期:2024-11-29
公开号:CN119516043B
公开日期:2025-12-05
类型:发明专利
摘要
本发明公开了一种基于大语言模型生成杂志封面或内页布局的方法,其特点是该方法包括:a) 利用大语言模型批量生成杂志页面上的元素、位置坐标的文本描述;b) 根据描述内容使用Hyper‑SD将元素逐个生成;c)对于单个物体的生成图,使用PP‑LiteSeg进行弱监督标注;d) 按照生成的元素位置描述,将单个元素组合成一张完整的杂志页面,同时组合他们的弱监督标签;e)使用自标注数据集矫正过的segformor对生成标注进行验证;f)基于众包对打标签的生成数据进行评估。本发明与现有技术相比具有生成速度快、生成图像带有准确标注、生成图像满足人类审美等优点,具有良好的应用前景。
技术关键词
大语言模型 杂志封面 杂志页面 布局 元素 高频特征 物体检测 弱监督方法 图像 语义分割模型 文本 数据 标签 视觉 坐标 人类 抗锯齿 融合特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号