摘要
本申请公开了一种基于多模态协同的服装试穿方法、设备及存储介质,涉及图像处理技术领域,包括:基于预定义的文本提示词模板提取服装的关键特征描述,并结合服装参考图的服装风格特征,对模特姿态图进行局部编辑预处理,生成模特服装试穿图;基于服装参考图的服装风格特征,确定对应的服装类别作为识别提示词,识别模特服装试穿图中的服装边界框;基于服装边界框,将模特服装试穿图中服装区域与背景区域进行区分,生成相应的分割掩码图;提取模特服装试穿图和服装参考图的特征向量,并将分割掩码图作为区域标识,结合注意力机制调整特征权重,进行特征融合得到服装上身效果图。本申请达成了提高生成的服装上身效果图像的细节表现力的技术效果。
技术关键词
服装试穿方法
多模态协同
模特
服装类别
注意力机制
融合特征
空间权重矩阵
分类器
标识
编辑
人体姿态变化
卷积神经网络模型
纹理特征
文本
人体关键点
款式
图像处理技术
标签
模板
系统为您推荐了相关专利信息
滑坡位移预测方法
环境监测数据
变量
注意力机制
序列
智能分级系统
多模态
跨模态融合特征
通道注意力机制
可见光
视频重建方法
视频帧
电信号
数据
时空注意力机制方法
钓鱼网站检测方法
图片
神经网络深度学习
矩阵
列表