一种基于扩散模型的图像生成方法、系统及存储介质

正文

推荐专利

申请号：CN202510485678

申请日期：2025-04-17

公开号：CN120430946A

公开日期：2025-08-05

类型：发明专利

摘要

一种基于扩散模型的图像生成方法、系统及存储介质，包括获取原始图像并进行预处理，得到人脸图像、眼睛区域掩膜、去除眼睛区域掩膜的人脸图像和仅保留眼睛区域的参考图；对人脸图像、去除眼睛区域掩膜的人脸图像和眼睛区域掩膜进行编码处理后输入Unet模型；获取文本提示词并进行编码处理，得到文本特征向量；对参考图进行编码处理与特征映射处理后，得到图像特征向量；将文本特征向量与图像特征向量通过交叉注意力机制输入Unet模型；获取睁眼程度调节参数，通过预训练的LoRA权重对Unet模型的输出进行调节；对Unet模型输出的潜变量进行解码，得到睁眼图像；将睁眼图像与原始图像的对应区域进行拼接和融合，得到图像生成结果。

技术关键词

图像生成方法图像特征向量文本特征向量眼睛掩膜图像生成程序编码模块交叉注意力机制人脸关键点图像生成系统文本编码器图像编码器可读存储介质颜色校正变量

系统为您推荐了相关专利信息

一种应用于对虾饲料的荚膜甲基球菌蛋白调配方法及系统

对虾饲料对虾饲养蛋白甲基图像特征向量

一种公共卫生虚假资讯自动识别系统

自动识别系统数据收集单元信息处理单元文本特征向量图像特征向量

智能终端的控制方法及智能终端

坐标触摸屏传感器眼部特征点注视点眼部模型

一种毫米级作物图像深度学习分析方法及系统

图像深度学习数字表面模型分析方法掩膜 GNSS定位数据

一种基于深度学习和水下光学模型的大坝水下缺陷图像生成方法

大坝图像生成方法光学成像水下图像数据风格

一种基于扩散模型的图像生成方法、系统及存储介质

站点导航

APP 下载