一种基于扩散模型和姿态估计的视频换装方法、装置及计算机可读存储介质

AITNT
正文
推荐专利
一种基于扩散模型和姿态估计的视频换装方法、装置及计算机可读存储介质
申请号:CN202510463834
申请日期:2025-04-14
公开号:CN120495466A
公开日期:2025-08-15
类型:发明专利
摘要
本发明属于计算机视觉领域与图像处理的技术领域,更具体地,涉及一种基于扩散模型和姿态估计的视频换装方法、装置及计算机可读存储介质。所述方法包括获取服装图像以及着装视频;搭建服装编解码模型和姿态估计模型;所述服装编解码模型包括服装编码模型和服装解码模型,分别用于提取图像的隐空间特征向量和还原图像的隐空间特征向量;所述姿态估计模型用于将姿态关键点与原视频数据进行融合;训练、测试服装编解码模型和姿态估计模型;搭建视频换装模型;训练视频换装模型。本发明解决了基于分割的传统方法由于缺乏对人体动态特性的精准建模,往往会出现服装与人物肢体不协调、动作场景失真以及换装效果生硬等问题。
技术关键词
姿态估计 换装方法 关键点 解码模型 交叉注意力机制 可读存储介质 视频数据特征 动态视频数据 编码向量 版图 生成样本数据 动态服装 图像编解码
系统为您推荐了相关专利信息
1
一种输电线路点云参数提取方法及系统
输电杆塔 参数提取方法 线路 直线段 坐标
2
一种面向交通管理的多模态驾驶状态评估系统
状态评估系统 中央处理机 视觉检测模块 子系统 存储模块
3
基于图像识别的车载屏手指操作轨迹跟踪分析方法及系统
车载屏 跟踪分析方法 手部关键点检测 视频流 跟踪分析系统
4
一种数字人稳定头部姿势生成的方法、装置及介质
稳定头部 坐标 姿势 人脸模型 人脸关键点
5
人脸模型训练方法、人脸重建方法、装置、设备及介质
人脸模型训练方法 关键点 人脸形状 人脸表情 参数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号