摘要
本发明属于计算机视觉领域,公开了基于先验引导知识蒸馏与风格感知的字体生成方法及系统,该方法包括两个训练阶段:第一阶段,训练以内容字符图像、风格参考图像和字符先验信息为条件输入的教师模型;第二阶段,通过知识蒸馏,训练仅以内容和风格图像为输入的学生模型,使其性能逼近教师模型。本发明提出了一种多方向风格感知Mamba模块用于提取全面而鲁棒的风格特征,以及一种分层多模态特征融合模块用于高效整合教师模型的多种输入;通过该方法,先验知识的指导作用被内化到学生模型中,使得模型在推理时即使缺乏先验信息也能生成内容准确、风格一致的高质量字体图像。
技术关键词
字体生成方法
风格
字符
图像
蒸馏
教师
学生
多模态特征融合
交叉注意力机制
噪声预测
分支
融合特征
编码器
可读存储介质
阶段
处理器
线性
系统为您推荐了相关专利信息
变电站设备状态
空间金字塔池化
强化特征
分支
红外图像特征
图像采集模块
成像模组
图像分析模块
主控模块
相机单元
验证规则
发票模板
图像识别模型
统一社会信用代码
文本