基于关键点引导文生图扩散模型的人脸生成方法

正文

推荐专利

申请号：CN202411894468

申请日期：2024-12-20

公开号：CN119762610B

公开日期：2025-09-30

类型：发明专利

摘要

本发明公开了一种基于关键点引导文生图扩散模型的人脸生成方法，首先收集数据信息，将人脸图像、文本描述信息和人脸关键点构成训练数据对，利用文本编码器对文本描述信息进行编码并转换为嵌入向量，利用隐空间编码器将人脸关键点图像信息映射到隐式空间；将高斯噪声图的隐式空间张量和人脸关键点图像信息的隐式空间张量进行拼接；建立隐式扩散模型并训练，对拼接的隐式空间张量不断迭代去噪，获取与关键点和文本描述信息对应的人脸图像，利用热力图引导下的去噪损失模块为关键点条件分配额外的训练注意力，使用隐空间解码器将隐式空间中的去噪结果映射到像素空间，最终重建出高生成质量和高图像与文本描述信息一致性的人脸图像。

技术关键词

人脸关键点人脸生成方法训练注意力图像文本编码器噪声解码器热力图编码器模块深度神经网络上采样数据分布采样模块

系统为您推荐了相关专利信息

一种适用于大尺寸玻璃的涂胶方法

像素点涂胶方法因子玻璃分布特征

一种基于AI技术生成虚拟试衣图像展示方法及系统

图像展示方法服装姿态特征虚拟试衣人体关键点

一种物流园区安全帽佩戴检测分割方法、系统和介质

安全帽佩戴检测场景特征语义分割网络分割方法卷积残差网络

基于图像识别与轨迹优化的炼钢残渣清理方法

三维环境模型可见光图像清理工具炼钢残渣全局路径规划

一种基于双网络协作的抗噪音标签图像识别方法

图像识别方法标签双网络网络图像识别样本

基于关键点引导文生图扩散模型的人脸生成方法

站点导航

APP 下载