摘要
本公开提供了一种多模态引导的可控创意字体生成方法及系统,涉及艺术字生成技术领域,包括:获取目标文本、目标字体及用于表征用户意图的多模态数据;基于多模态数据,生成转换提示和艺术设计提示;从目标文本、目标字体中提取多条路径,根据转换提示选择相似度最高的路径进行字形变换,得到变换后的图像;利用多掩码引导的扩散过程,使用艺术设计提示作为提示,为变换后的图像生成最终的艺术字形图像;本发明通过多模态引导,利用扩散模型的创意纹理生成,解决现有方法在艺术字形生成中的局限性,尤其在艺术表达与可读性、精确控制以及多语言适应性等方面提供更好的解决方案。
技术关键词
字体生成方法
多模态
图像
文本
电子设备
处理器
意图
存储器
艺术字
数据获取模块
生成技术
计算机程序产品
生成系统
多语言
关键字
轮廓