摘要
本发明公开了一种基于扩散模型的精细可控图像风格化方法。该方法包括:获取训练数据,其中,训练数据为一组与拥有对齐风格属性的样本数据,样本数据包括内容图像、笔触图像、颜色图像、文本信息和目标图像;对内容图像、笔触图像和颜色图像隐式地进行特征解耦处理,得到内容属性特征、笔触属性特征和颜色属性特征;将内容属性特征、笔触属性特征、颜色属性特征和文本信息通过适应性门控机制融合并注入至可控扩散模型中,结合目标图像,得到预测图像。本发明解决了现有技术中未解耦参考图像中的多种细粒度的风格属性,造成难以精细、灵活地控制风格转移的技术问题。
技术关键词
图像风格化方法
注意力
颜色
文本
噪声
计算机可执行指令
图像生成模型
全局特征提取
数据
图像编码器
可读存储介质
大语言模型
计算机程序产品
样本
计算机系统
机制
处理器
系统为您推荐了相关专利信息
螺旋桨故障诊断
动态门控
声学特征
视觉特征
注意力
可靠性分析方法
人因可靠性分析
可靠性分析模型
累积分布函数
操作规程
智能管理方法
精细化结构
视频
视觉特征
场景切换点
多信号检测方法
电磁频谱监测
矩阵
特征提取网络
短时傅里叶变换