摘要
本发明公开一种基于轨迹的免训练图像生成方法、电子设备和存储介质,实现简单、用户友好、可控的图像生成,其包括:获取用户绘制的轨迹及其轨迹线段对应的控制文本标签,并获取文本提示;根据控制文本标签对各轨迹线段计算距离矩阵,对文本提示进行分词并提取文本特征,对轨迹的控制文本标签进行分词并计算其在文本提示被分词后的列表中的下标;初始化稳定扩散模型的潜在特征;根据控制文本标签的下标,对预训练的稳定扩散模型的Unet模型部分的特定层的交叉注意力分别计算各控制文本标签的控制损失和移动损失并梯度回传,然后基于稳定扩散模型无分类引导的去噪过程更新潜在特征;重复直至完成去噪,最后解码更新后的潜在特征得到生成图像。
技术关键词
图像生成方法
轨迹
标签
代表
分词
注意力
线段
文本编码器
电子设备
矩阵
计算机
参数
可读存储介质
解码
列表
视觉
存储器
处理器