摘要
本发明属于计算机视觉领域与图像处理的技术领域,更具体地,涉及一种基于扩散模型和姿态估计的视频换装方法、装置及计算机可读存储介质。所述方法包括获取服装图像以及着装视频;搭建服装编解码模型和姿态估计模型;所述服装编解码模型包括服装编码模型和服装解码模型,分别用于提取图像的隐空间特征向量和还原图像的隐空间特征向量;所述姿态估计模型用于将姿态关键点与原视频数据进行融合;训练、测试服装编解码模型和姿态估计模型;搭建视频换装模型;训练视频换装模型。本发明解决了基于分割的传统方法由于缺乏对人体动态特性的精准建模,往往会出现服装与人物肢体不协调、动作场景失真以及换装效果生硬等问题。
技术关键词
姿态估计
换装方法
关键点
解码模型
交叉注意力机制
可读存储介质
视频数据特征
动态视频数据
编码向量
版图
生成样本数据
动态服装
图像编解码
系统为您推荐了相关专利信息
状态评估系统
中央处理机
视觉检测模块
子系统
存储模块
车载屏
跟踪分析方法
手部关键点检测
视频流
跟踪分析系统
人脸模型训练方法
关键点
人脸形状
人脸表情
参数