一种基于上下文与掩模集成模块的多模态服装图像生成方法

正文

推荐专利

申请号：CN202510184815

申请日期：2025-02-19

公开号：CN120298517A

公开日期：2025-07-11

类型：发明专利

摘要

本发明涉及一种基于上下文与掩模集成模块的多模态服装图像生成方法，本发明的上下文与掩模集成模块整合了先进的Mamba卷积层和掩模自适应交叉注意力机制，首先，Mamba卷积层高效地捕捉局部和全局上下文信息，缓解了传统自注意力机制固有的计算效率问题，其次，MACA机制根据输入掩模调整注意力权重，增强了模型对关键视觉特征的响应，并聚焦于将掩模模态与其他模态对齐。这一双重机制确保模型能够准确理解和匹配复杂设计元素之间的依赖关系，从而提高生成图像的精度和一致性。通过CM IM的设计，我们能够生成精确的边界框，定义每个服装元素的位置和大小，这些边界框随后输入扩散模型以生成最终的高质量服装设计图像。

技术关键词

集成模块图像生成方法交叉注意力机制视觉特征掩模文本编码器服装融合特征输入解码器多模态特征语义矩阵随机噪声

系统为您推荐了相关专利信息

一种融合多视角信息的纯稀疏3D目标检测方法

融合多视角信息融合多视角特征稀疏特征交叉注意力机制人工智能深度学习

一种不完全信息条件下水面目标的跟踪系统和跟踪方法

跟踪系统多传感器融合系统多模态滑动窗口机制卷积神经网络模型

一种基于深度学习的畜禽育种表型观测方法及系统

观测方法视觉特征提取卷积模型多模态交互矩阵

一种图像文本联合数据处理方法、设备及介质

数据处理方法文本颜色像素图像数据集合

分子活性预测方法、装置、设备、存储介质及程序产品

活性预测方法分子交互特征蛋白口袋

一种基于上下文与掩模集成模块的多模态服装图像生成方法

站点导航

APP 下载