摘要
本申请实施例提供一种图像编辑和模型训练方法、设备、存储介质及程序产品。在本申请实施例中,提供一种图文编辑模型,从字形维度和风格维度针对原始图像的目标文本区域进行图像编辑,在字形维度,通过文本编码特征和字符形态特征为图像编辑的准确性提供保障,且保持与背景的一致性;在风格维度,通过注入文本风格特征,支持保留原始图像风格以及额外风格,提高图像编辑的可用率。从字形和风格两个维度进行图像编辑,可以提高所得图像的图像质量。进一步,在布局维度,模型训练过程中,通过布局损失函数,自适应学习布局信息,支持各种对齐方式局部以及横纵向修改,进一步提高图像质量。
技术关键词
编码特征
字形特征
样本
图文
文本内容特征
形态
模型训练方法
布局特征
交叉注意力机制
风格
图像编辑方法
字符识别模型
图像生成模型
处理器
系统为您推荐了相关专利信息
风险预测方法
风险预测模型
差异表达基因
差异表达分析
预后预测方法
路径规划方法
鲁棒性
强化学习模型
网络结构
误差
医学图像分割方法
标签
医学图像数据集
合成器
标记