摘要
本发明公开了一种基于跨空间调节的文本驱动的风格迁移方法,包括:利用预训练的深度卷积神经网络VGG‑19从任意一张给定的照片中提取内容特征;利用预训练的CLIP文本编码器从任意一个给定的文本提示中提取风格特征;构造跨空间调节模块,用于弥合VGG特征空间和CLIP特征空间之间的差异;构造内容损失函数、定向CLIP损失函数、块对块CLIP损失函数以及基于CLIP的风格对比损失函数,用于约束风格迁移网络的生成过程,最终得到与目标内容和目标风格相符的艺术图像。本发明能够将文本中所描述的艺术风格迁移到日常照片上,创造出新的艺术图像,提升了艺术图像创意生成的灵活性和创新性,在文化创意、影视制作、工业设计等诸多领域有着重要的科学意义和应用价值。
技术关键词
风格迁移方法
文本编码器
代表
深度卷积神经网络
图像编码器
照片
样本
输入解码器
处理器
计算机程序产品
图像块
可读存储介质
模块
存储器
电子设备
系统为您推荐了相关专利信息
人体模型
编码解码器
蒙皮
文本编码器
大语言模型
内容提取方法
知识图谱构建
语义向量空间
音频编码器
文本编码器