摘要
本发明公开了一种基于扩散模型的图像风格化方法,包括以下步骤:S1,输入原始图像;S2,对原始图像分成上步骤和下步骤进行处理,上步骤和下步骤中均在前向过程中还原为初始高斯噪声图像;S3,将上步骤中的初始高斯噪声图像,在反向过程中以噪扩散隐式模型DDIM逐步去噪,得到原始去噪图像,然后提取出空间特征S4,将下步骤中的初始高斯噪声图像,在反向过程中以文本条件稳定扩散模型LDM逐步去噪,同时加入步骤S3中得到的空间特征及输入引导文本,输出风格图像。本发明提高了原始图像结构的保真度,减轻原始图像不必要外观泄漏的问题,提高风格图像的风格化程度。
技术关键词
图像风格化方法
噪声图像
图像结构
概率生成模型
注意力
文本
噪声预测
键值
亲和力
分类器
图片
线性
模块
系统为您推荐了相关专利信息
输电线路覆冰
数据特征工程
时序
历史气象数据
联合损失函数
轨迹预测模型
夹抱车
高维特征向量
编码器
油门踏板行程
归并方法
机器可读程序
语义特征提取
直方图均衡化方法
合规性管理