一种基于扩散模型的图像生成方法、系统及存储介质

AITNT
正文
推荐专利
一种基于扩散模型的图像生成方法、系统及存储介质
申请号:CN202510485678
申请日期:2025-04-17
公开号:CN120430946A
公开日期:2025-08-05
类型:发明专利
摘要
一种基于扩散模型的图像生成方法、系统及存储介质,包括获取原始图像并进行预处理,得到人脸图像、眼睛区域掩膜、去除眼睛区域掩膜的人脸图像和仅保留眼睛区域的参考图;对人脸图像、去除眼睛区域掩膜的人脸图像和眼睛区域掩膜进行编码处理后输入Unet模型;获取文本提示词并进行编码处理,得到文本特征向量;对参考图进行编码处理与特征映射处理后,得到图像特征向量;将文本特征向量与图像特征向量通过交叉注意力机制输入Unet模型;获取睁眼程度调节参数,通过预训练的LoRA权重对Unet模型的输出进行调节;对Unet模型输出的潜变量进行解码,得到睁眼图像;将睁眼图像与原始图像的对应区域进行拼接和融合,得到图像生成结果。
技术关键词
图像生成方法 图像特征向量 文本特征向量 眼睛 掩膜 图像生成程序 编码模块 交叉注意力机制 人脸关键点 图像生成系统 文本编码器 图像编码器 可读存储介质 颜色校正 变量
系统为您推荐了相关专利信息
1
一种应用于对虾饲料的荚膜甲基球菌蛋白调配方法及系统
对虾饲料 对虾饲养 蛋白 甲基 图像特征向量
2
一种公共卫生虚假资讯自动识别系统
自动识别系统 数据收集单元 信息处理单元 文本特征向量 图像特征向量
3
智能终端的控制方法及智能终端
坐标 触摸屏传感器 眼部特征点 注视点 眼部模型
4
一种毫米级作物图像深度学习分析方法及系统
图像深度学习 数字表面模型 分析方法 掩膜 GNSS定位数据
5
一种基于深度学习和水下光学模型的大坝水下缺陷图像生成方法
大坝 图像生成方法 光学成像 水下图像数据 风格
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号