摘要
本发明公开了基于交叉注意分层融合的潜在扩散虚拟试穿研究方法,涉及潜在扩散虚拟试穿技术领域,包括采用HRNet方法对人体图像进行分析,提取人体姿态高分辨率特征图,得到人体18个关键点的位置信息;采用Warp‑HR模块将人体18个关键点的位置信息与服装图像相结合,通过仿射变换调整服装的局部区域,完成服装翘曲,得到与用户姿势匹配的服装形状;采用CLIP文本编码器对复杂人体姿态进行自然语言描述并编码,得到人体姿态文本描述,同时使用CLIP图像编码器对人体姿态图像进行编码,得到人体姿态图像编码;基于人体姿态图像编码,获取精准人体姿态信息,解决复杂姿态下的虚拟试穿问题;使用CLIP编码器将人体图像、目标服装以及人体姿态文本描述转换至潜在空间。
技术关键词
人体
文本编码器
图像编码器
服装
自然语言
关键点
表达式
分层
文本特征向量
图像特征向量
虚拟试穿技术
姿势
电子商务平台
度函数
图像特征提取