摘要
本发明公开了一种基于扩散模型和笔触增强的通用风格迁移方法,涉及多媒体技术领域,包括如下步骤:首先对输入的内容图像和风格图像在扩散模型的潜在空间进行加噪处理,从而获得内容噪声特征和风格噪声特征;然后利用流场图生成、通道融合、边缘增强以及通道交换操作对内容图像进行特征提取,以获得笔触纹理特征;最后,在笔触纹理特征的引导下,通过扩散模型的逆过程来融合内容特征和风格特征使风格化噪声特征逐步去噪,并在图像解码器的解码下生成内容完整风格笔触增强的风格化图像。本发明通过将扩散模型和笔触增强同时应用在通用风格迁移中,克服了通用风格迁移中内容生成质量不高和风格笔触偏弱的问题,减少了风格迁移网络的训练成本。
技术关键词
风格迁移方法
噪声特征
纹理特征
流场特征
图像解码器
注意力模型
通道
残差模块
生成方法
定义
编码器
滤波器
强度
网络