一种基于稳定扩散模型的草图引导图像生成方法及系统

AITNT
正文
推荐专利
一种基于稳定扩散模型的草图引导图像生成方法及系统
申请号:CN202510692800
申请日期:2025-05-27
公开号:CN120525985A
公开日期:2025-08-22
类型:发明专利
摘要
本发明提出了一种基于稳定扩散模型的草图引导图像生成方法及系统,属于图像处理技术领域,包括:获取草图数据及文本数据;将所述草图数据及文本数据输入构建的多模态条件输入模块,所述多模态条件输入模块包括边缘特征提取模块、文本编码器,所述边缘特征提取模块提取所述草图数据的边缘结构特征,所述文本编码器提取所述文本数据的文本特征生成语义特征向量,得到多模态特征;基于预训练的稳定扩散模型将所述多模态特征通过扩散过程生成清晰图像。本发明生成的图像在结构上符合要求,能够有效缓解生成图像局部扭曲问题。
技术关键词
图像生成方法 多模态特征 特征提取模块 文本编码器 输入模块 上采样 生成对抗网络 残差模块 图像生成系统 采样模块 计算机 微调技术 图像处理技术 数据获取模块
系统为您推荐了相关专利信息
1
一种答案确定方法、装置、电子设备及存储介质
文本 上下文特征 语义特征 样本 图像
2
一种用于规划意向图生成的多条件约束融合生成方法及系统
规划 生成方法 多头注意力机制 评估指标体系 数据
3
基于ViSAR的多目标跟踪方法、装置、存储介质及电子设备
跟踪方法 影像 线性变换矩阵 特征提取模块 线索
4
一种基于多模态同步的数字人智能交互与姿态表情合成方法
时间同步 融合特征 生成对抗网络架构 多模态特征 校正算法
5
一种基于sEMG信号的仿生机械手控制方法、系统、设备和存储介质
仿生机械手 BP神经网络 抓取动作 识别标签 操作者手臂
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号