摘要
本申请属于人工智能领域,涉及一种图像生成方法,包括:获取目标图像;采用预设的图文编码模型,对目标图像进行编码,得到目标图像的图像特征向量;根据图像特征向量,通过反向优化生成与目标图像特征相似的文本提示词;采用图文编码模型,对文本提示词进行向量化,得到文本提示词的文本特征向量;将文本特征向量输入预设的扩散模型,生成与文本提示词语义相似的风格图像。本申请还提供一种装置、设备及介质。此外,本申请还涉及区块链技术,目标图像、文本提示词和风格图像可存储于区块链中。本申请可以提高图像生成的准确性。
技术关键词
文本特征向量
图像特征向量
图像生成方法
计算机可读指令
图文
梯度下降算法
风格
文本编码器
词语
池化特征
语义特征
图像生成装置
可读存储介质
区块链技术
序列
编码模块
处理器
系统为您推荐了相关专利信息
套刻标记
区域生成方法
曲线
计算机可读指令
电子设备
集群机器人
量子态
定位导航方法
计算机可读取存储介质
定位导航设备
集群资源调度方法
服务器
节点
计算机可读指令
资源调度装置
智能交警机器人
多模态特征
图像特征提取
车辆特征提取
图像特征向量