一种基于扩散模型的一致性身份图片生成方法

正文

推荐专利

申请号：CN202411538257

申请日期：2024-10-31

公开号：CN119478090A

公开日期：2025-02-18

类型：发明专利

摘要

本发明属于计算机视觉领域，具体涉及一种基于扩散模型的一致性身份图片生成方法，包括：采用多模态大语言模型生成最优的成对数据，其中成对数据包括文本数据和对应的图像数据；采用文本编码器对文本数据进行编码处理，得到文本嵌入向量；采用图像编码器对图像数据进行处理，得到图像嵌入向量；将文本嵌入向量和图像嵌入向量输入到MLP模块中将进入融合，得到融合嵌入向量；将所有的融合嵌入向量进行堆叠，并采用交叉注意力层对堆叠的融合嵌入向量进行处理，得到深层次特征；对深层次特征进行多阶段调整，得到一致性身份图片；本申请采用由粗到细的多阶段微调方法，逐步优化生成图像的视觉质量。

技术关键词

图片生成方法文本编码器文本生成模型身份图像嵌入多模态图像编码器大语言模型数据多层感知机多阶段注意力机制多层次特征生成文字特征提取器微调方法计算机视觉

系统为您推荐了相关专利信息

一种具备快递送货功能的门禁管理方法及系统

门禁机快递单门禁管理系统门禁管理方法门禁控制器

一种云计算下电力系统数据处理方法及系统

下电力系统数据访问权限数据处理方法密钥交换算法身份

物流数据的校验方法、装置、计算机设备和存储介质

身份验证实体信誉评分数据欺诈检测货物运输车辆

文本生成方法、装置、电子设备和存储介质

文本生成模型实体文本生成方法知识图谱向量关系

一种身份证OCR识别方法及系统

OCR识别方法身份证照片深度学习算法识别系统训练集数据

一种基于扩散模型的一致性身份图片生成方法

站点导航

APP 下载