摘要
本发明公开了一种基于扩散模型的服装实物图生成方法和装置,包括:收集历史服装实物图的数据并按风格打标签,微调出带有服装实物图风格的LoRA适配器;提取设计图的软边缘特征,生成控制条件;使用多模态模型提取出设计图的语义信息;使用提示词工程技术结合语义信息和设计师意图生成提示词;输入提示词和控制条件,采用扩散模型并结合LoRA适配器生成与设计稿和设计师意图相符的实物图;手动对生成的实物图中与预期不符的区域进行选择,在控制未选中区域不变的基础上对选中区域重新执行图像生成流程,值得满足设计师想要的效果,这样能够实现操作便捷和高质量的服装实物图展示图象生成。
技术关键词
生成方法
服装
文本
图像
语义特征
生成提示词
边缘检测算法
适配器
打标签
意图
风格
元素
解码器
注意力机制
分辨率
图文
生成装置
处理器
编码
系统为您推荐了相关专利信息
三维重建方法
单目深度估计
多视角
联合损失函数
训练神经网络
特征提取模块
人脑
特征提取网络
多层感知器
阿尔茨海默症
无痛胃肠镜检查
风险预测模型
风险预测系统
残差模块
习惯性打鼾
联合压缩感知
编码模板
高空间分辨率成像
色散棱镜
成像透镜