摘要
本申请涉及一种图像转换方法、系统、计算机设备以及存储介质。包括:获取原始图像的图像描述文本,并通过文本编码器,根据目标描述文本和图像描述文本确定原始文本嵌入向量和目标文本嵌入向量;通过深度神经网络模型,根据原始文本嵌入向量和目标文本嵌入向量确定融合文本嵌入向量;通过稳定扩散模型,根据融合文本嵌入向量对原始图像进行图像转换,确定目标图像。上述方案,能够在原始图像进行图像转换的过程中,尽量保持原始图像的特征结构,提高了图像转换结果的准确性,使得获取的目标图像具有期望的视觉观感。
技术关键词
深度神经网络模型
融合语义信息
文本编码器
图像转换方法
词嵌入向量
语义特征
图像转换系统
深度学习网络
注意力
图像嵌入
文本输入界面
序列
计算机设备
矩阵
图像分类模型
预训练模型
展示界面
系统为您推荐了相关专利信息
图像语义分割方法
多模态特征融合
文本编码器
图像编码器
报告
动态面部表情
面部表情特征
文本特征向量
识别方法
多模态
编码器模块
适配器
编码特征
特征金字塔网络
注意力
视觉SLAM方法
室内动态场景
融合语义信息
动态物体
特征提取模块