摘要
本发明涉及图像生成技术领域,具体涉及一种基于大语言模型的文本生成矢量图形的方法及系统,包括:对收集的SVG数据进行优化;对优化后的SVG数据进行渲染,得到对应的光栅化图像,使用多模态大模型针对光栅化图像生成相应的标签作为基础文本描述,构建多模态数据集;多模态数据集中的每个条目均是由优化后的SVG数据、对应的光栅化图像和基础文本描述组成的三元组;将SVG数据和基础文本描述输入GPT大模型,生成针对SVG数据的详细文本描述;将SVG数据、对应的光栅化图像和详细文本描述与收集的指令数据集组合起来,作为训练集,分别在理解任务和生成任务下,对预先构建的基础大语言模型进行训练。本发明可生成精细且语义一致的SVG矢量图形。
技术关键词
大语言模型
光栅化图像
文本
数据
多模态
语义
基础
标记
图像生成技术
阶段
标签
三元组
冗余
条目
多轮对话
元素
指令
训练集
画布
矩阵