基于先验引导知识蒸馏与风格感知的字体生成方法及系统

正文

推荐专利

申请号：CN202511432275

申请日期：2025-10-09

公开号：CN120912419A

公开日期：2025-11-07

类型：发明专利

摘要

本发明属于计算机视觉领域，公开了基于先验引导知识蒸馏与风格感知的字体生成方法及系统，该方法包括两个训练阶段：第一阶段，训练以内容字符图像、风格参考图像和字符先验信息为条件输入的教师模型；第二阶段，通过知识蒸馏，训练仅以内容和风格图像为输入的学生模型，使其性能逼近教师模型。本发明提出了一种多方向风格感知Mamba模块用于提取全面而鲁棒的风格特征，以及一种分层多模态特征融合模块用于高效整合教师模型的多种输入；通过该方法，先验知识的指导作用被内化到学生模型中，使得模型在推理时即使缺乏先验信息也能生成内容准确、风格一致的高质量字体图像。

技术关键词

字体生成方法风格字符图像蒸馏教师学生多模态特征融合交叉注意力机制噪声预测分支融合特征编码器可读存储介质阶段处理器线性