基于可控图像扩散模型的真实场景下视频虚拟试衣框架

正文

推荐专利

申请号：CN202411435170

申请日期：2024-10-15

公开号：CN119444555A

公开日期：2025-02-14

类型：发明专利

摘要

本发明公开了基于可控图像扩散模型的真实场景下视频虚拟试衣框架，包括：数据预处理模块：用于构建人物和衣服的特征表达；单阶段图像试衣网络：用于基于预处理后的数据生成虚拟试衣图像，并使用交叉注意力机制进行衣服的隐式变形和融合；扩散引导模块：用于增强生成视频的时序一致性，引入自监督模型Video MAE和自监督图像模型DINO‑V2，自监督模型Video MAE将视频进行掩码，通过帧间信息重建出完整的视频；长视频生成模块：用于生成长视频并保持视频的一致性，通过将完整视频拆分为多个短视频片段，并使用时序共同降噪策略减少片段连接处的抖动。本发明设计扩散引导模块，通过自监督学习实现高效时序一致的视频虚拟试衣，具备遮挡处理优和长视频生成稳定等优点。

技术关键词

虚拟试衣特征提取单元图像交叉注意力机制衣服特征人物特征短视频场景框架时序裁剪衣服噪声预测模块序列阶段网络解码器

系统为您推荐了相关专利信息

会议纪要记录方法、装置、设备及可读存储介质

情绪状态信息会议纪要记录方法音频视频多媒体

车内情绪数据的匿名化处理方法及系统

多模态情绪情绪特征数据情绪识别模型分布式麦克风阵列

一种多屏幕拼接智能控制系统

拼接智能亮度显示驱动模块多屏幕分析模块

一种稻米整精米率的评估方法及应用

参数水稻整精米率果皮数值优化算法突变体植株

鱼眼镜头的标定方法、设备及存储介质

激光模块坐标系标定方法畸变模型参数

基于可控图像扩散模型的真实场景下视频虚拟试衣框架

站点导航

APP 下载