摘要
本申请公开了一种基于多模态协同的服装试穿方法、设备及存储介质,涉及图像处理技术领域,包括:基于预定义的文本提示词模板提取服装的关键特征描述,并结合服装参考图的服装风格特征,对模特姿态图进行局部编辑预处理,生成模特服装试穿图;基于服装参考图的服装风格特征,确定对应的服装类别作为识别提示词,识别模特服装试穿图中的服装边界框;基于服装边界框,将模特服装试穿图中服装区域与背景区域进行区分,生成相应的分割掩码图;提取模特服装试穿图和服装参考图的特征向量,并将分割掩码图作为区域标识,结合注意力机制调整特征权重,进行特征融合得到服装上身效果图。本申请达成了提高生成的服装上身效果图像的细节表现力的技术效果。
技术关键词
服装试穿方法
多模态协同
模特
服装类别
注意力机制
融合特征
空间权重矩阵
分类器
标识
编辑
人体姿态变化
卷积神经网络模型
纹理特征
文本
人体关键点
款式
图像处理技术
标签
模板
系统为您推荐了相关专利信息
深度学习网络
遥感卫星影像
卫星影像数据
场景分类
高层语义特征
数据安全管控
时序
深度学习模型
分层策略
特征提取网络
识别置信度
生成动态环境
识别方法
多模态
机器人
对话生成方法
策略
异构
双向注意力
对话生成模型
视频序列分割方法
融合特征
融合专家
多尺度局部特征
矩阵