一种基于扩散模型和姿态估计的视频换装方法、装置及计算机可读存储介质

正文

推荐专利

申请号：CN202510463834

申请日期：2025-04-14

公开号：CN120495466A

公开日期：2025-08-15

类型：发明专利

摘要

本发明属于计算机视觉领域与图像处理的技术领域，更具体地，涉及一种基于扩散模型和姿态估计的视频换装方法、装置及计算机可读存储介质。所述方法包括获取服装图像以及着装视频；搭建服装编解码模型和姿态估计模型；所述服装编解码模型包括服装编码模型和服装解码模型，分别用于提取图像的隐空间特征向量和还原图像的隐空间特征向量；所述姿态估计模型用于将姿态关键点与原视频数据进行融合；训练、测试服装编解码模型和姿态估计模型；搭建视频换装模型；训练视频换装模型。本发明解决了基于分割的传统方法由于缺乏对人体动态特性的精准建模，往往会出现服装与人物肢体不协调、动作场景失真以及换装效果生硬等问题。

技术关键词

姿态估计换装方法关键点解码模型交叉注意力机制可读存储介质视频数据特征动态视频数据编码向量版图生成样本数据动态服装图像编解码

系统为您推荐了相关专利信息

一种输电线路点云参数提取方法及系统

输电杆塔参数提取方法线路直线段坐标

一种面向交通管理的多模态驾驶状态评估系统

状态评估系统中央处理机视觉检测模块子系统存储模块

基于图像识别的车载屏手指操作轨迹跟踪分析方法及系统

车载屏跟踪分析方法手部关键点检测视频流跟踪分析系统

一种数字人稳定头部姿势生成的方法、装置及介质

稳定头部坐标姿势人脸模型人脸关键点

人脸模型训练方法、人脸重建方法、装置、设备及介质

人脸模型训练方法关键点人脸形状人脸表情参数

一种基于扩散模型和姿态估计的视频换装方法、装置及计算机可读存储介质

站点导航

APP 下载