摘要
本发明提出了一种基于稳定扩散模型的草图引导图像生成方法及系统,属于图像处理技术领域,包括:获取草图数据及文本数据;将所述草图数据及文本数据输入构建的多模态条件输入模块,所述多模态条件输入模块包括边缘特征提取模块、文本编码器,所述边缘特征提取模块提取所述草图数据的边缘结构特征,所述文本编码器提取所述文本数据的文本特征生成语义特征向量,得到多模态特征;基于预训练的稳定扩散模型将所述多模态特征通过扩散过程生成清晰图像。本发明生成的图像在结构上符合要求,能够有效缓解生成图像局部扭曲问题。
技术关键词
图像生成方法
多模态特征
特征提取模块
文本编码器
输入模块
上采样
生成对抗网络
残差模块
图像生成系统
采样模块
计算机
微调技术
图像处理技术
数据获取模块
系统为您推荐了相关专利信息
规划
生成方法
多头注意力机制
评估指标体系
数据
时间同步
融合特征
生成对抗网络架构
多模态特征
校正算法
仿生机械手
BP神经网络
抓取动作
识别标签
操作者手臂