一种用于高保真虚拟试穿的双阶段潜在扩散系统

AITNT
正文
推荐专利
一种用于高保真虚拟试穿的双阶段潜在扩散系统
申请号:CN202510747437
申请日期:2025-06-05
公开号:CN120635239A
公开日期:2025-09-12
类型:发明专利
摘要
本发明公开了一种用于高保真虚拟试穿的双阶段潜在扩散系统及方法,首先通过第一扩散网络在潜在空间中建立服装与人体间的语义对应关系,并结合输入的服装图像、人体图像及可选的掩码图像,生成适应目标姿势的变形服装;然后引入基于条件扩散的跨模态融合网络,将第一阶段生成的变形服装、原始服装图像的VAE编码以及目标人物图像的VAE编码作为输入,通过多尺度特征融合,整合语义结构、原始服装纹理和人体姿势,最终合成高质量的虚拟试穿图像。本发明通过双阶段渐进式生成策略及特定网络结构,解决了现有虚拟试穿方法在细节保留、语义对齐、训练稳定性及生成质量等方面的挑战,能够生成细节丰富、纹理逼真、姿态匹配的高保真虚拟试穿效果。
技术关键词
变形服装 扩散系统 交叉注意力机制 多尺度特征融合 图像解码单元 图像编码器 人体姿势 语义结构 阶段 网络 虚拟试穿方法 纹理 解码器
系统为您推荐了相关专利信息
1
基于优化算法的视觉-语言模型图文对精准评测数据构建方法
数据构建方法 图文 视觉 图片 算法
2
一种基于改进RT-DETR的竹筷缺陷检测实时方法
竹筷 实时检测方法 多尺度特征金字塔 跨尺度特征融合 缺陷类别
3
一种电路板表面缺陷检测方法和系统
表面缺陷检测方法 深度学习模型 相似性度量函数 通道注意力机制 原始图像数据
4
多分支DLMDMLP和对抗生成的深度伪造检测方法
输出特征 动态门控 序列 多尺度特征融合 轻量级卷积神经网络
5
一种基于AI大模型的视觉交互多功能机器人
多功能机器人 手势识别单元 激活语音对话 机器学习算法 手势轨迹识别
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号