摘要
本申请涉及一种图像风格翻译方法、系统、计算机设备以及存储介质。包括:将源图像输入稳定扩散模型,确定源图像的图像潜在表示;将源图像输入到目标编码器,确定原始潜在向量;通过深度神经网络模型的实例归一化层对原始潜在向量进行处理,确定归一化潜在向量;确定源图像的时间步嵌入向量,通过所述深度神经网络根据归一化潜在向量和时间步嵌入向量确定目标潜在向量;通过深度学习图像识别模型,基于时间步嵌入向量对目标参考图像进行风格特征提取,确定目标参考图像的风格嵌入向量;通过稳定扩散模型,根据图像潜在表示、目标潜在向量和风格嵌入向量,生成目标翻译图像。提高了对源图像进行图像风格翻译的准确性。
技术关键词
深度学习图像识别
深度神经网络模型
风格
翻译方法
翻译系统
多层感知机
计算机设备
编码向量
编码器
解码器
展示界面
生成方式
矩阵
元素
处理器
可读存储介质
存储器
数据
系统为您推荐了相关专利信息
大语言模型
文本
预测用户满意度
计算机可读指令
关键点
机器翻译方法
语法结构
机器翻译模型
文本
双语对齐语料