基于关键点引导文生图扩散模型的人脸生成方法

AITNT
正文
推荐专利
基于关键点引导文生图扩散模型的人脸生成方法
申请号:CN202411894468
申请日期:2024-12-20
公开号:CN119762610B
公开日期:2025-09-30
类型:发明专利
摘要
本发明公开了一种基于关键点引导文生图扩散模型的人脸生成方法,首先收集数据信息,将人脸图像、文本描述信息和人脸关键点构成训练数据对,利用文本编码器对文本描述信息进行编码并转换为嵌入向量,利用隐空间编码器将人脸关键点图像信息映射到隐式空间;将高斯噪声图的隐式空间张量和人脸关键点图像信息的隐式空间张量进行拼接;建立隐式扩散模型并训练,对拼接的隐式空间张量不断迭代去噪,获取与关键点和文本描述信息对应的人脸图像,利用热力图引导下的去噪损失模块为关键点条件分配额外的训练注意力,使用隐空间解码器将隐式空间中的去噪结果映射到像素空间,最终重建出高生成质量和高图像与文本描述信息一致性的人脸图像。
技术关键词
人脸关键点 人脸生成方法 训练注意力 图像 文本编码器 噪声 解码器 热力图 编码器模块 深度神经网络 上采样 数据分布 采样模块
系统为您推荐了相关专利信息
1
一种适用于大尺寸玻璃的涂胶方法
像素点 涂胶方法 因子 玻璃 分布特征
2
一种基于AI技术生成虚拟试衣图像展示方法及系统
图像展示方法 服装 姿态特征 虚拟试衣 人体关键点
3
一种物流园区安全帽佩戴检测分割方法、系统和介质
安全帽佩戴检测 场景特征 语义分割网络 分割方法 卷积残差网络
4
基于图像识别与轨迹优化的炼钢残渣清理方法
三维环境模型 可见光图像 清理工具 炼钢残渣 全局路径规划
5
一种基于双网络协作的抗噪音标签图像识别方法
图像识别方法 标签 双网络 网络图像识别 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号