基于大语言模型的文本生成矢量图形的方法及系统

正文

推荐专利

申请号：CN202510545518

申请日期：2025-04-28

公开号：CN120472047A

公开日期：2025-08-12

类型：发明专利

摘要

本发明涉及图像生成技术领域，具体涉及一种基于大语言模型的文本生成矢量图形的方法及系统，包括：对收集的SVG数据进行优化；对优化后的SVG数据进行渲染，得到对应的光栅化图像，使用多模态大模型针对光栅化图像生成相应的标签作为基础文本描述，构建多模态数据集；多模态数据集中的每个条目均是由优化后的SVG数据、对应的光栅化图像和基础文本描述组成的三元组；将SVG数据和基础文本描述输入GPT大模型，生成针对SVG数据的详细文本描述；将SVG数据、对应的光栅化图像和详细文本描述与收集的指令数据集组合起来，作为训练集，分别在理解任务和生成任务下，对预先构建的基础大语言模型进行训练。本发明可生成精细且语义一致的SVG矢量图形。

技术关键词

大语言模型光栅化图像文本数据多模态语义基础标记图像生成技术阶段标签三元组冗余条目多轮对话元素指令训练集画布矩阵

基于大语言模型的文本生成矢量图形的方法及系统

站点导航

APP 下载