摘要
本发明涉及计算机视觉的技术领域,提出自适应多模态融合与动态特征强化的虚拟试穿方法及系统,包括以下步骤:获取若干个图像组;利用多模态大模型生成图像组的每张图像的文本描述;对于每个图像组,将人体图像中应被服装图像对应的服装覆盖的区域进行遮罩,对经遮罩处理的图像组中的每张图像添加对应的文本描述,得到经添词处理的图像组;利用经添词处理的图像组训练用于生成虚拟试穿预测图像的虚拟试穿模型,得到训练好的虚拟试穿模型;向训练好的虚拟试穿模型输入待试穿的服装图像、目标人体图像和/或提示文本,所述虚拟试穿模型对输入数据进行特征提取和特征融合后转换为虚拟试穿预测图像输出。
技术关键词
虚拟试穿方法
人体模型
文本
多模态特征
服装
图文
拼接模块
预训练模型
动态
输出特征
噪声图像
注意力机制
表达式
人体姿势
虚拟试穿系统
三维动画软件
系统为您推荐了相关专利信息
内容识别方法
狄利克雷分布模型
三元组
节点
热点